OpenAI presenta GPT-4o, el seu model avançat que integra text, àudio i visió. Ofereix respostes en temps real, superant els models anteriors en rapidesa i cost, amb millors capacitats multilingües i de comprensió visual i auditiva.
OpenAI ha anunciat el llançament de GPT-4o, el seu model d'intel·ligència artificial més recent, dissenyat per entendre i generar text, àudio i imatges de manera integrada. Aquest model, conegut com "omni" per la seva capacitat multimodal, respon a entrades d'àudio en només 232 mil·lisegons de mitjana, comparable al temps de resposta humà en converses.
GPT-4o no només manté el rendiment de GPT-4 Turbo en anglès i programació, sinó que també millora significativament el seu rendiment en altres idiomes, sent més ràpid i un 50% més econòmic en l'API. A més, mostra un avanç notable en la comprensió visual i auditiva en comparació amb els models anteriors.
A diferència dels models anteriors que utilitzaven diversos models per gestionar entrades i sortides d'àudio, text i visió, GPT-4o utilitza una única xarxa neuronal entrenada de manera integral per processar tots aquests tipus de dades. Això permet una interacció més natural i rica, capturant tons, múltiples parlants i sons de fons, i pot generar rialles, cançons i emocions.
El model ha estat avaluat i ha demostrat rendir a nivells superiors en benchmarks tradicionals de text, raonament i codificació, així com en noves proves de percepció visual i auditiva. A més, OpenAI ha implementat rigoroses mesures de seguretat i avaluacions de risc per mitigar possibles perills, assegurant que GPT-4o no superi el risc mitjà en cap categoria de seguretat.
GPT-4o està disponible immediatament per a usuaris gratuïts i subscriptors Plus de ChatGPT, amb capacitats de text i imatge. Pròximament, es farà suport per a àudio i vídeo a un grup selecte de socis en l'API. Aquest llançament marca un pas significatiu cap a la interacció humà-computadora més natural i eficient.
Per a més informació, visita l'anunci oficial.
ChatGPT t'ajuda a obtenir respostes, trobar inspiració i ser més productiu. És gratuït i fàcil de provar. Només has de preguntar, i ChatGPT pot ajudar-te amb l'escriptura, l'aprenentatge, la ...
OpenAI desenvolupa intel·ligència artificial amb un enfocament en la seguretat i el benefici social. La companyia integra investigació avançada i principis ètics per impulsar tecnologies d'IA de ...
15/01/2026
Replit ha llançat Mobile Apps on Replit, una funcionalitat que permet descriure una idea, crear l'aplicació i publicar-la completament a l'App ...
14/01/2026
Google ha presentat Personal Intelligence, una funció que permet a Gemini accedir a informació d'aplicacions com Gmail, Google Photos i YouTube per ...
07/01/2026
OpenAI ha presentat ChatGPT Health, una experiència dedicada que permet als usuaris connectar els seus historials mèdics i aplicacions de benestar ...
05/01/2026
Amazon presenta Alexa.com, una nova plataforma que porta el seu assistent d'intel·ligència artificial Alexa+ al navegador web i completa la seva ...