bet ú de :Temos os melhores relatórios de previsão, você está convidado a participar
A OpenAI deixou o seu maior anúncio para o fim. Na última das 12 lives que fezbet údezembro, a companhia anunciou o seu mais novo modelo, o OpenAI o3, sucessor do OpenAI o1. Ao contrário da família "GPT", a classe "o" é focadabet úraciocínio lógico, matemática e programação, e foi mostrada inicialmentebet úsetembro. Segundo a companhia, o o3 exibe sinais de avanços poderosos e, por isso, não foi disponibilizada inicialmente para o público, apenas para pesquisadores de segurança.
Ao contrário de outros grandes modelos de linguagem (LLMs), que tentam responder imediatamente a um comando, a família aborda os problemasbet úetapas, de forma parecida com aquilo que humanos fazem quando se deparam com tarefas complexas. O sistema avalia cada estágio na construção da resposta, o que permite a correção de erros e adoção de novas estratégias - um processo chamado de cadeia de pensamento (ou chain of thought).
PublicidadeAté aqui, LLMs melhoravambet úcapacidade de resposta apenas aumentando o tamanho dos dadosbet úque eram treinados - uma vez treinado, o sistema tenta responder o mais rápido possível, buscando a conexões mais comuns entre palavras. Agora, os pesquisadores demonstraram que a performance também melhora quando é investido mais tempo de processamento para o sistema avaliar os dados que já possui, o que permite a busca por diferentes caminhos a uma resposta. Neste mês, o Google também apresentou a nova versão do Gemini, que apresenta recursos para raciocinar as respostas, algo que deve se tornar comum entre os maiores modelos de IA do mundo.
O curioso é que a OpenAI desistiu do nome "o2? para não causar confusão com a empresa de telecomunicação britânica "O2?.
Nos testes apresentados pela OpenAI, o o3 acertou 96,7% das questões das Olimpíadas de Matemática dos EUA contra 83% da o1. Já no GPQA Diamond, um teste com perguntas de nível PhD, a nova versão saltou 78% para 87,7%. No teste SWE-Bench Verified, que mede habilidadesbet úprogramação, o sistema atingiu a nota de 2727 - uma nota de 2400 já o classifica no 1% entre os programadores mais habilidosos do mundo.
Publicidade