OpenAI llança GPT-4o, model multimodal més ràpid i econòmic

13/05/2024

OpenAI presenta GPT-4o, el seu model avançat que integra text, àudio i visió. Ofereix respostes en temps real, superant els models anteriors en rapidesa i cost, amb millors capacitats multilingües i de comprensió visual i auditiva.

OpenAI llança GPT-4o, model multimodal més ràpid i econòmic

OpenAI ha anunciat el llançament de GPT-4o, el seu model d'intel·ligència artificial més recent, dissenyat per entendre i generar text, àudio i imatges de manera integrada. Aquest model, conegut com "omni" per la seva capacitat multimodal, respon a entrades d'àudio en només 232 mil·lisegons de mitjana, comparable al temps de resposta humà en converses.

GPT-4o no només manté el rendiment de GPT-4 Turbo en anglès i programació, sinó que també millora significativament el seu rendiment en altres idiomes, sent més ràpid i un 50% més econòmic en l'API. A més, mostra un avanç notable en la comprensió visual i auditiva en comparació amb els models anteriors.

A diferència dels models anteriors que utilitzaven diversos models per gestionar entrades i sortides d'àudio, text i visió, GPT-4o utilitza una única xarxa neuronal entrenada de manera integral per processar tots aquests tipus de dades. Això permet una interacció més natural i rica, capturant tons, múltiples parlants i sons de fons, i pot generar rialles, cançons i emocions.

El model ha estat avaluat i ha demostrat rendir a nivells superiors en benchmarks tradicionals de text, raonament i codificació, així com en noves proves de percepció visual i auditiva. A més, OpenAI ha implementat rigoroses mesures de seguretat i avaluacions de risc per mitigar possibles perills, assegurant que GPT-4o no superi el risc mitjà en cap categoria de seguretat.

GPT-4o està disponible immediatament per a usuaris gratuïts i subscriptors Plus de ChatGPT, amb capacitats de text i imatge. Pròximament, es farà suport per a àudio i vídeo a un grup selecte de socis en l'API. Aquest llançament marca un pas significatiu cap a la interacció humà-computadora més natural i eficient.

Per a més informació, visita l'anunci oficial.

Vídeos

IA relacionada

ChatGPT

L'assistent d'IA

ChatGPT t'ajuda a obtenir respostes, trobar inspiració i ser més productiu. És gratuït i fàcil de provar. Només has de preguntar, i ChatGPT pot ajudar-te amb l'escriptura, l'aprenentatge, la ...

OpenAI

Investigació i desenvolupament en IA responsable

OpenAI desenvolupa intel·ligència artificial amb un enfocament en la seguretat i el benefici social. La companyia integra investigació avançada i principis ètics per impulsar tecnologies d'IA de ...

Últimes noticies

Trustpilot
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.