Mistral ha revolucionat el sector de la IA amb Small 3, un model de codi obert innovador que ofereix un rendiment excepcional utilitzant només una fracció dels recursos habituals. Aquesta nova tecnologia aconsegueix resultats comparables als de sistemes molt més grans i costosos, marcant un punt d’inflexió en l’eficiència de la IA.
El panorama de la intel·ligència artificial fa un nou gir amb el llançament de Mistral Small 3. Aquest model de codi obert, publicat sota llicència Apache 2.0, estableix un nou estàndard en la relació entre mida i rendiment. Amb només 24.000 milions de paràmetres, arriba a un 81% de precisió en proves estàndard, igualant el rendiment de sistemes com Llama 3.3 70B, que utilitza gairebé el triple de recursos.
La principal innovació de Mistral Small 3 rau en el seu disseny optimitzat, que li permet processar 150 tokens per segon, duplicant la velocitat de models similars. La seva arquitectura, amb menys capes que els models competidors, redueix significativament el temps de processament sense comprometre el rendiment.
El model destaca especialment en quatre àrees clau: assistència conversacional de resposta ràpida, execució de funcions amb baixa latència, capacitat d’ajust fi per crear experts en matèries específiques i capacitat d’inferència local. Aquesta darrera característica permet que funcioni en equips relativament modestos, com una RTX 4090 o un MacBook amb 32 GB de RAM, reduint els costos d’implementació fins a un 70% en comparació amb els models tradicionals.
Disponible gratuïtament en plataformes com Hugging Face, Ollama, Kaggle i Together AI, Mistral Small 3 representa un pas important en la democratització de la intel·ligència artificial. L’empresa ha anunciat que a finals de 2024 llançarà una versió empresarial amb capacitats ampliades, tot mantenint el seu compromís amb el codi obert per a la versió bàsica del model.
Aquest enfocament equilibrat entre accessibilitat i rendiment posiciona Mistral com un competidor seriós en un mercat tradicionalment dominat per grans corporacions com OpenAI i Anthropic, demostrant que la innovació en IA no sempre requereix recursos massius.
Mistral AI desenvolupa models de llenguatge portables amb capacitats multilingües i alta eficiència computacional. La plataforma permet implementacions al núvol o locals, amb opcions de ...
03/06/2025
ElevenLabs ha llançat Eleven v3 (alpha), un model de conversió de text a veu que incorpora eines de control emocional i capacitats de diàleg ...
29/05/2025
Black Forest Labs presenta FLUX.1 Kontext, una nova família de models d'intel·ligència artificial que permet generar i editar imatges utilitzant ...
22/05/2025
Anthropic presenta Claude Opus 4 i Sonnet 4, models d'intel·ligència artificial que assoleixen nous registres en avaluacions de codi i incorporen ...
16/05/2025
Codex és un agent basat en intel·ligència artificial que optimitza el desenvolupament de programari automatitzant múltiples tasques ...