OpenAI lance GPT-4o, un modèle multimodal plus rapide et abordable

13/05/2024

OpenAI présente GPT-4o, son modèle avancé intégrant texte, audio et vision. Il offre des réponses en temps réel, surpassant les modèles précédents en rapidité et coût, avec de meilleures capacités multilingues et de compréhension visuelle et auditive.

OpenAI lance GPT-4o, un modèle multimodal plus rapide et abordable

OpenAI a annoncé le lancement de GPT-4o, son dernier modèle d'intelligence artificielle conçu pour comprendre et générer du texte, de l'audio et des images de manière intégrée. Ce modèle, connu sous le nom de "omni" pour sa capacité multimodale, répond aux entrées audio en seulement 232 millisecondes en moyenne, ce qui est comparable au temps de réponse humain dans les conversations.

GPT-4o ne maintient pas seulement la performance de GPT-4 Turbo en anglais et en programmation, mais améliore également de manière significative sa performance dans d'autres langues, étant plus rapide et 50% moins cher dans l'API. De plus, il montre une avancée notable dans la compréhension visuelle et auditive par rapport aux modèles précédents.

Contrairement aux modèles précédents qui utilisaient plusieurs modèles pour gérer les entrées et sorties audio, texte et vision, GPT-4o utilise un seul réseau neuronal formé de manière intégrale pour traiter tous ces types de données. Cela permet une interaction plus naturelle et riche, capturant les tons, plusieurs locuteurs et les sons de fond, et peut générer des rires, des chansons et des émotions.

Le modèle a été évalué et a démontré une performance supérieure dans les benchmarks traditionnels de texte, de raisonnement et de codage, ainsi que dans de nouveaux tests de perception visuelle et auditive. De plus, OpenAI a mis en place des mesures de sécurité rigoureuses et des évaluations de risques pour atténuer les dangers potentiels, en veillant à ce que GPT-4o ne dépasse pas un risque moyen dans aucune catégorie de sécurité.

GPT-4o est immédiatement disponible pour les utilisateurs gratuits et les abonnés ChatGPT Plus, avec des capacités de texte et d'image. Bientôt, le support pour l'audio et la vidéo sera ajouté à un groupe sélectionné de partenaires dans l'API. Ce lancement marque une étape significative vers une interaction homme-machine plus naturelle et efficace.

Pour plus d'informations, visitez l'annonce officielle.

Vidéos

IA connexe

ChatGPT

L'assistant IA

ChatGPT vous aide à obtenir des réponses, à trouver de l'inspiration et à être plus productif. Il est gratuit et facile à essayer. Posez simplement une question, et ChatGPT peut vous aider à ...

OpenAI

Recherche et développement en IA responsable

OpenAI développe une intelligence artificielle axée sur la sécurité et le bénéfice social. L'entreprise intègre des recherches avancées et des principes éthiques pour promouvoir des ...

Dernières nouvelles

Trustpilot
Ce site utilise des cookies techniques, de personnalisation et d’analyse, propres et tiers, pour faciliter la navigation anonyme et analyser les statistiques d’utilisation du site. Nous considérons que si vous continuez à naviguer, vous acceptez leur utilisation.