OpenAI presenta GPT-4o, el seu model avançat que integra text, àudio i visió. Ofereix respostes en temps real, superant els models anteriors en rapidesa i cost, amb millors capacitats multilingües i de comprensió visual i auditiva.
OpenAI ha anunciat el llançament de GPT-4o, el seu model d'intel·ligència artificial més recent, dissenyat per entendre i generar text, àudio i imatges de manera integrada. Aquest model, conegut com "omni" per la seva capacitat multimodal, respon a entrades d'àudio en només 232 mil·lisegons de mitjana, comparable al temps de resposta humà en converses.
GPT-4o no només manté el rendiment de GPT-4 Turbo en anglès i programació, sinó que també millora significativament el seu rendiment en altres idiomes, sent més ràpid i un 50% més econòmic en l'API. A més, mostra un avanç notable en la comprensió visual i auditiva en comparació amb els models anteriors.
A diferència dels models anteriors que utilitzaven diversos models per gestionar entrades i sortides d'àudio, text i visió, GPT-4o utilitza una única xarxa neuronal entrenada de manera integral per processar tots aquests tipus de dades. Això permet una interacció més natural i rica, capturant tons, múltiples parlants i sons de fons, i pot generar rialles, cançons i emocions.
El model ha estat avaluat i ha demostrat rendir a nivells superiors en benchmarks tradicionals de text, raonament i codificació, així com en noves proves de percepció visual i auditiva. A més, OpenAI ha implementat rigoroses mesures de seguretat i avaluacions de risc per mitigar possibles perills, assegurant que GPT-4o no superi el risc mitjà en cap categoria de seguretat.
GPT-4o està disponible immediatament per a usuaris gratuïts i subscriptors Plus de ChatGPT, amb capacitats de text i imatge. Pròximament, es farà suport per a àudio i vídeo a un grup selecte de socis en l'API. Aquest llançament marca un pas significatiu cap a la interacció humà-computadora més natural i eficient.
Per a més informació, visita l'anunci oficial.
ChatGPT t'ajuda a obtenir respostes, trobar inspiració i ser més productiu. És gratuït i fàcil de provar. Només has de preguntar, i ChatGPT pot ajudar-te amb l'escriptura, l'aprenentatge, la ...
OpenAI desenvolupa intel·ligència artificial amb un enfocament en la seguretat i el benefici social. La companyia integra investigació avançada i principis ètics per impulsar tecnologies d'IA de ...
25/05/2026
El papa Lleó XIV publica la primera encíclica dedicada a la intel·ligència artificial, en la qual fixa la dignitat humana com a criteri per a tot ...
11/05/2026
Thinking Machines Lab ha publicat una vista prèvia de recerca de TML-Interaction-Small, un model d'interacció dissenyat per col·laborar amb ...
24/04/2026
DeepSeek llança en versió preliminar la seva família V4, dos models de codi obert capaços de processar fins a un milió de tokens de context i ...
23/04/2026
OpenAI llança GPT-5.5, un model dissenyat per executar tasques complexes de forma autònoma: programar, investigar, analitzar dades i operar ...