ElevenLabs ha llançat Eleven v3 (alpha), un model de conversió de text a veu que incorpora eines de control emocional i capacitats de diàleg multi-parlant per a aplicacions de contingut multimèdia.
Black Forest Labs presenta FLUX.1 Kontext, una nova família de models d'intel·ligència artificial que permet generar i editar imatges utilitzant tant text com imatges de referència, amb velocitats fins a 8 vegades superiors.
Anthropic presenta Claude Opus 4 i Sonnet 4, models d'intel·ligència artificial que assoleixen nous registres en avaluacions de codi i incorporen capacitats de raonament estès.
Codex és un agent basat en intel·ligència artificial que optimitza el desenvolupament de programari automatitzant múltiples tasques simultàniament. OpenAI ha llançat una versió preliminar per als usuaris de ChatGPT Pro, Team i Enterprise.
Mistral AI ha anunciat el llançament de Medium 3, un nou model d'intel·ligència artificial que combina un rendiment d'avantguarda amb un cost vuit vegades inferior, facilitant la seva adopció empresarial.
Xiaomi presenta MiMo-7B, un model de llenguatge de codi obert que, amb només 7.000 milions de paràmetres, supera models més grans en tasques complexes de raonament matemàtic i programació.
OpenAI presenta una nova generació de models entrenats per raonar durant més temps abans de respondre, capaços de combinar totes les eines de ChatGPT i establir nous estàndards en rendiment acadèmic i tasques del món real, representant un pas endavant cap a un ChatGPT més autònom.
Meta llança Llama 4 Scout i Llama 4 Maverick, els seus primers models d'IA multimodals amb arquitectura de barreja d'experts, oferint rendiment superior a GPT-4o i Gemini en diversos benchmarks mentre anticipa Llama 4 Behemoth, el seu model de 2 bilions de paràmetres.
Amazon presenta un model d'intel·ligència artificial que permet als desenvolupadors crear agents autònoms capaços d'interactuar amb pàgines web i realitzar tasques complexes sense supervisió constant, millorant significativament l'automatització de processos digitals.
Google presenta Gemini 2.5 Pro, el seu model d'intel·ligència artificial més intel·ligent fins ara. Aquesta nova versió destaca per la seva capacitat de raonament, millorant significativament el rendiment en tasques complexes de matemàtiques, ciència i programació.
Google ha llançat Gemma 3, una nova família de models d'IA de codi obert, lleugers i avançats dissenyats per funcionar en dispositius convencionals. Aquesta tecnologia de codi obert, derivada de la mateixa recerca que Gemini 2.0, promet democratitzar l'accés a la intel·ligència artificial.
L'empresa d'intel·ligència artificial ha desenvolupat una eina d'OCR que, segons les proves comparatives publicades, mostra més precisió en el processament de documents amb elements com equacions matemàtiques, taules i contingut multilingüe.
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.