A OpenAI surpreendeu o mundo da inteligência artificial (IA) nesta segunda-feira (13) ao revelar o ChatGPT 4o, o mais recente avanço em sua série de modelos de conversação. Com uma performance que lembra o aclamado filme "Ela" (dirigido por Spike Jonze em 2013), a empresa demonstrou as notáveis melhorias do GPT-4o sobre seu predecessor, o GPT-4 Turbo, elevando não só a capacidade de processamento de texto e compreensão de imagens, mas também mantendo o suporte para interações por voz.
De acordo com a OpenAI, em comparação com o GPT-4 atual, o GPT-4o oferece o dobro de velocidade no processamento de respostas, enquanto reduz os custos em 50%, tornando-se ainda mais acessível para os usuários. O modelo também ostenta uma capacidade cinco vezes maior. Agora, cada 1 milhão de tokens (pequenos segmentos de palavras) custa apenas US$ 5, em contraste com os US$ 10 do GPT-4 Turbo. A empresa anunciou que a nova IA estará disponível gratuitamente para todos os usuários da OpenAI, inclusive para os não assinantes do plano ChatGPT Plus.
A executiva-chefe de tecnologia da OpenAI, Mira Murati, liderou demonstrações impressionantes, destacando a habilidade do ChatGPT em lidar com imagens e voz. As interações revelaram uma IA não apenas mais inteligente, mas também mais natural em suas respostas, resultando em diálogos menos robóticos e mais próximos do estilo humano. Além disso, o chatbot demonstrou sua capacidade de compreender emoções humanas.
Murati também anunciou que o GPT-4o estará disponível como uma API, permitindo que desenvolvedores e empresas integrem facilmente a inteligência artificial em uma variedade de produtos e serviços. Além disso, a OpenAI revelou melhorias em mais de 50 idiomas.
Outro destaque do evento foi o lançamento de um novo aplicativo ChatGPT para Mac, da Apple, facilitando ainda mais a integração do chatbot nas tarefas diárias dos usuários.
Este anúncio precedeu o tão aguardado evento anual do Google, o Google I/O, que também promete inovações significativas na área de IA. Especula-se que a empresa demonstre as capacidades de sua IA Gemini como assistente pessoal.
Implicações para a competição
O evento da OpenAI não apenas apresentou as capacidades aprimoradas do ChatGPT-4o, mas também destacou seu potencial como concorrente direto de assistentes pessoais como Siri, da Apple, e Alexa, da Amazon. O modelo impressiona ao combinar funcionalidades de assistência por voz com a capacidade de processar imagens do mundo real através da câmera de smartphones. A principal vantagem sobre os concorrentes é a capacidade única do ChatGPT-4o de realizar todas essas funções em um único modelo.
Na demonstração, a IA foi capaz de narrar histórias com diferentes entonações vocais, desde emocionadas até totalmente robóticas. Além disso, utilizando a câmera do celular, o ChatGPT ajudou a resolver equações matemáticas simples escritas em papel e atuou como tradutor em tempo real durante uma conversa. Segundo a OpenAI, essas funcionalidades estarão disponíveis para os usuários nas próximas semanas.