
A empresa de IA de Elon Musk, xAI, lançou tarde da noite de segunda-feira seu mais recente modelo principal de IA, o Grok 3, e revelou novas capacidades para os aplicativos Grok iOS e web.
\n\nO Grok, resposta da xAI a modelos como o GPT-4o da OpenAI e o Gemini do Google, pode analisar imagens e responder a perguntas, e alimenta uma série de recursos na rede social de Musk, a X. O Grok 3, que estava em desenvolvimento há vários meses, estava previsto para lançamento em 2024, mas não cumpriu esse prazo.
\n\nO lançamento de segunda-feira é ambicioso.
\n\nA xAI está utilizando um enorme centro de dados em Memphis contendo cerca de 200.000 GPUs para treinar o Grok 3. Em um post na X, Musk afirmou que o Grok 3 foi desenvolvido com "10x" mais poder de computação do que seu antecessor, o Grok 2, usando um conjunto de dados de treinamento expandido que inclui, aparentemente, registros de processos judiciais.
\n\n
O Grok 3 é uma família de modelos, para ser preciso. Uma versão menor do Grok 3, o Grok 3 mini, responde a perguntas mais rapidamente, ao custo de alguma precisão. Nem todos os modelos e recursos relacionados do Grok 3 estão disponíveis ainda (alguns estão em beta), mas começaram a ser lançados na segunda-feira.
\n\nA xAI afirma que o Grok 3 supera o GPT-4o em benchmarks, incluindo AIME (que avalia o desempenho de um modelo em uma amostra de questões matemáticas) e GPQA (que avalia os modelos usando problemas de física, biologia e química de nível de PhD). Uma versão inicial do Grok 3 também teve pontuações competitivas na Chatbot Arena, um teste colaborativo que coloca diferentes modelos de IA uns contra os outros e tem usuários votando em suas respostas preferidas, de acordo com a xAI.
\n
Dois modelos na nova família Grok 3, Grok 3 Reasoning e Grok 3 mini Reasoning, podem "pensar cuidadosamente" sobre problemas, semelhantes aos modelos de "raciocínio" como o o3-mini da OpenAI e o R1 da empresa de IA chinesa DeepSeek. Modelos de raciocínio tentam fazer fact-checking antes de fornecer resultados, o que os ajuda a evitar algumas das armadilhas que normalmente atrapalham os modelos.
\n\nA xAI afirma que o Grok 3 Reasoning supera a melhor versão do o3-mini - o3-mini-high - em vários benchmarks populares, incluindo um benchmark de matemática mais recente chamado AIME 2025.
\n
Esses modelos de raciocínio podem ser acessados através do aplicativo Grok. Os usuários podem pedir ao Grok 3 para “Pensar” ou, para consultas mais difíceis, usar o modo “Big Brain” para raciocínio que emprega computação adicional. A xAI descreve os modelos de raciocínio como mais adequados para perguntas de matemática, ciência e programação.
\n\nMusk disse que alguns dos "pensamentos" dos modelos de raciocínio são obscurecidos no aplicativo Grok para evitar a destilação, um método usado pelos desenvolvedores de modelos de IA para extrair conhecimento de outros modelos. Recentemente, a DeepSeek foi acusada de destilar os modelos da OpenAI para criar os seus próprios.
\n\nOs modelos de raciocínio do Grok sustentam um novo recurso no aplicativo Grok chamado DeepSearch, resposta da xAI a ferramentas de pesquisa alimentadas por IA como a pesquisa profunda da OpenAI. O DeepSearch escaneia a internet e a X para analisar informações e fornecer um resumo em resposta a uma pergunta.
\n\nOs assinantes do plano Premium+ da X ($50 por mês) terão acesso ao Grok 3 primeiro, e outros recursos serão condicionados a um novo plano que a xAI está chamando de SuperGrok. Com preço de $30 por mês ou $300 por ano (se os vazamentos forem verdadeiros), o SuperGrok destrava consultas adicionais de raciocínio e DeepSearch, e inclui geração ilimitada de imagens.
\n
No futuro - talvez em cerca de uma semana - o aplicativo Grok ganhará um "modo de voz", disse Musk, que dará aos modelos do Grok uma voz sintetizada. Algumas semanas depois, os modelos do Grok 3 estarão disponíveis através da API empresarial da xAI, juntamente com a capacidade DeepSearch.
\n\nA xAI planeja abrir o código do Grok 2 nos próximos meses, disse Musk.
\n\n“Nossa abordagem geral é que iremos abrir o código da última versão [do Grok] quando a próxima versão estiver totalmente disponível”, continuou. “Quando o Grok 3 estiver maduro e estável, o que provavelmente acontecerá dentro de alguns meses, então iremos abrir o código do Grok 2.”
\n\nQuando Musk anunciou o Grok há cerca de dois anos, ele apresentou o modelo de IA como edgy, sem filtro e anti-“pensamento correto” - em geral, disposto a responder a questões controversas que outros sistemas de IA não responderiam. Ele cumpriu parte dessa promessa. Se mandado ser vulgar, por exemplo, o Grok e o Grok 2 estariam felizes em ajudar, proferindo linguagem colorida que provavelmente não se ouviria do ChatGPT.
\n\nMas os modelos do Grok antes do Grok 3 se esquivaram de assuntos políticos e não ultrapassariam certos limites. Na verdade, um estudo descobriu que o Grok pendia para a esquerda política em tópicos como direitos transgêneros, programas de diversidade e desigualdade.
\n\nMusk culpou o comportamento nos dados de treinamento do Grok - páginas web públicas - e se comprometeu a “aproximar o Grok politicamente neutro”. Ainda não está claro se a xAI alcançou esse objetivo e quais seriam as consequências.
\n\n