OpenAI présente GPT-4o, son modèle avancé intégrant texte, audio et vision. Il offre des réponses en temps réel, surpassant les modèles précédents en rapidité et coût, avec de meilleures capacités multilingues et de compréhension visuelle et auditive.
OpenAI a annoncé le lancement de GPT-4o, son dernier modèle d'intelligence artificielle conçu pour comprendre et générer du texte, de l'audio et des images de manière intégrée. Ce modèle, connu sous le nom de "omni" pour sa capacité multimodale, répond aux entrées audio en seulement 232 millisecondes en moyenne, ce qui est comparable au temps de réponse humain dans les conversations.
GPT-4o ne maintient pas seulement la performance de GPT-4 Turbo en anglais et en programmation, mais améliore également de manière significative sa performance dans d'autres langues, étant plus rapide et 50% moins cher dans l'API. De plus, il montre une avancée notable dans la compréhension visuelle et auditive par rapport aux modèles précédents.
Contrairement aux modèles précédents qui utilisaient plusieurs modèles pour gérer les entrées et sorties audio, texte et vision, GPT-4o utilise un seul réseau neuronal formé de manière intégrale pour traiter tous ces types de données. Cela permet une interaction plus naturelle et riche, capturant les tons, plusieurs locuteurs et les sons de fond, et peut générer des rires, des chansons et des émotions.
Le modèle a été évalué et a démontré une performance supérieure dans les benchmarks traditionnels de texte, de raisonnement et de codage, ainsi que dans de nouveaux tests de perception visuelle et auditive. De plus, OpenAI a mis en place des mesures de sécurité rigoureuses et des évaluations de risques pour atténuer les dangers potentiels, en veillant à ce que GPT-4o ne dépasse pas un risque moyen dans aucune catégorie de sécurité.
GPT-4o est immédiatement disponible pour les utilisateurs gratuits et les abonnés ChatGPT Plus, avec des capacités de texte et d'image. Bientôt, le support pour l'audio et la vidéo sera ajouté à un groupe sélectionné de partenaires dans l'API. Ce lancement marque une étape significative vers une interaction homme-machine plus naturelle et efficace.
Pour plus d'informations, visitez l'annonce officielle.
ChatGPT vous aide à obtenir des réponses, à trouver de l'inspiration et à être plus productif. Il est gratuit et facile à essayer. Posez simplement une question, et ChatGPT peut vous aider à ...
OpenAI développe une intelligence artificielle axée sur la sécurité et le bénéfice social. L'entreprise intègre des recherches avancées et des principes éthiques pour promouvoir des ...
05/02/2026
Kuaishou Technology a présenté Kling AI 3.0, qui comprend quatre nouveaux modèles de génération vidéo et image avec des améliorations ...
02/02/2026
SpaceX a acquis xAI pour créer un système intégré d'intelligence artificielle et de technologie spatiale. L'entreprise a annoncé des centres de ...
29/01/2026
Project Genie, le nouveau prototype de Google DeepMind, permet de créer, explorer et modifier des mondes interactifs grâce à l'IA. Les ...
22/01/2026
Anthropic a rendu publique la constitution actualisée de Claude, le document qui définit les valeurs et les comportements de son modèle ...