A OpenAI anunciou na segunda-feira, dia 13, o lançamento do GPT-4o, uma versão aprimorada do renomado modelo de linguagem GPT-4, o cérebro por trás do famoso ChatGPT. De acordo com a empresa, essa atualização traz uma notável melhoria em velocidade, além de aprimoramentos nos recursos de texto, visão e áudio.
O que já se sabe sobre o GPT-4o
O GPT-4o representa um avanço significativo em direção a uma interação mais natural entre humanos e computadores. Conforme declarado no anúncio oficial da empresa, o modelo é capaz de processar uma variedade de entradas, incluindo texto, áudio e imagem, e produzir saídas correspondentes em qualquer formato desejado.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
Sam Altman, CEO da OpenAI, enfatizou que o modelo é “nativamente multimodal”, ou seja, capaz de compreender e gerar conteúdo em voz, texto e imagens. Ele descreveu o GPT-4o como o melhor modelo já desenvolvido pela empresa, destacando sua inteligência, rapidez e capacidade multimodal.
Uma das impressionantes características do GPT-4o é sua capacidade de responder a entradas de áudio em apenas 232 milissegundos, aproximando-se do tempo de resposta humano em uma conversa. Além disso, foram implementadas melhorias significativas no processamento de texto em diversos idiomas, tornando-o mais versátil e abrangente. Em relação à compreensão de imagem e áudio, o GPT-4o supera outros modelos existentes em termos de eficiência e precisão.
Altman também anunciou que os desenvolvedores terão acesso à API do GPT-4o, que oferece desempenho superior a um custo reduzido em comparação com o GPT-4-turbo, sendo duas vezes mais rápida e com metade do preço.
Novo modelo gratuito para todos os usuários
A nova versão do GPT-4 estará disponível gratuitamente para todos os usuários do ChatGPT. Os recursos aprimorados de texto e imagem do GPT-4o começarão a ser implementados ainda hoje no chatbot. Além disso, para os usuários pagos Plus, os limites de mensagens serão aumentados em até cinco vezes.
Antes do lançamento, havia especulações sobre a possibilidade de a OpenAI revelar um mecanismo de busca com inteligência artificial para competir com o Google, um assistente de voz integrado ao GPT-4, ou até mesmo um novo e aprimorado modelo, o GPT-5. No entanto, essas expectativas não se concretizaram. De qualquer forma, é importante destacar que essa novidade chega um dia antes do Google I/O, a principal conferência da gigante da tecnologia, na qual também são esperados vários lançamentos relacionados à inteligência artificial.