OpenAI estrena models d’IA de codi obert amb raonament avançat

05/08/2025

OpenAI presenta gpt-oss-120b i gpt-oss-20b, els seus primers models de llenguatge de codi obert des de GPT-2, disponibles sota llicència Apache 2.0 amb pesos accessibles per a descàrrega gratuïta.

OpenAI estrena models d’IA de codi obert amb raonament avançat

La companyia nord-americana ha presentat dos nous models d'intel·ligència artificial de codi obert que incorporen capacitats avançades de raonament. Els models gpt-oss-120b i gpt-oss-20b representen el primer llançament de models de llenguatge amb pesos accessibles d'OpenAI des de la publicació de GPT-2.

El model gpt-oss-120b compta amb 117.000 milions de paràmetres totals i activa 5.100 milions per token, mentre que gpt-oss-20b disposa de 21.000 milions de paràmetres totals i activa 3.600 milions per token. Tots dos utilitzen arquitectura transformer amb barreja d'experts (MoE) per reduir els paràmetres actius necessaris durant el processament.

Els models estan optimitzats per funcionar en maquinari de consum. El gpt-oss-120b opera eficientment en una GPU de 80 GB, mentre que el gpt-oss-20b pot executar-se en dispositius edge amb només 16 GB de memòria. Aquesta capacitat tècnica els fa accessibles per a desenvolupadors independents i organitzacions amb recursos limitats.

En les avaluacions comparatives, gpt-oss-120b assoleix un rendiment proper a o4-mini en proves bàsiques de raonament i supera o3-mini en programació competitiva, matemàtiques i ús d'eines. El model més petit, gpt-oss-20b, iguala o supera o3-mini en les mateixes avaluacions.

Els models incorporen raonament en cadena complet (CoT) sense supervisió directa, una característica que OpenAI considera fonamental per a la detecció de comportaments inadequats. Els desenvolupadors poden ajustar l'esforç de raonament en tres nivells (baix, mitjà i alt) per equilibrar latència i rendiment segons les seves necessitats.

OpenAI ha implementat mesures de seguretat específiques per a models oberts. La companyia va realitzar proves entrenant els models amb dades malicioses per avaluar possibles usos inadequats, concloent que els models modificats amb fins maliciosos no assoleixen nivells alts de capacitat segons el seu marc de preparació. Aquesta metodologia va ser revisada per tres grups independents d'experts externs.

Per fomentar la seguretat de l'ecosistema, OpenAI ha organitzat un Red Teaming Challenge amb un fons de premis de 500.000 dòlars per identificar nous riscos de seguretat en els models.

El procés d'entrenament d'aquests models es va basar en un conjunt de dades d'alta qualitat, principalment en anglès, amb especial èmfasi en disciplines STEM (ciència, tecnologia, enginyeria i matemàtiques), programació i coneixement general. Aquesta selecció de continguts busca optimitzar les capacitats de raonament tècnic i científic dels models.

Els arxius estan disponibles gratuïtament a Hugging Face. La companyia ha establert col·laboracions amb plataformes com Azure, AWS, vLLM, Ollama i fabricants de maquinari com NVIDIA, AMD, Cerebras i Groq per facilitar la implementació. Microsoft portarà versions optimitzades del model gpt-oss-20b a dispositius Windows a través d'ONNX Runtime.

Aquest llançament busca accelerar la recerca en intel·ligència artificial i reduir les barreres d'accés per a mercats emergents i organitzacions amb recursos limitats. OpenAI considera que un ecosistema saludable de models oberts és fonamental per fer la IA més accessible i democràtica. La companyia avaluarà si els avantatges d'aquests models justifiquen futures inversions en desenvolupaments de codi obert.

IA relacionada

OpenAI

Investigació i desenvolupament en IA responsable

OpenAI desenvolupa intel·ligència artificial amb un enfocament en la seguretat i el benefici social. La companyia integra investigació avançada i principis ètics per impulsar tecnologies d'IA de ...

Últimes noticies

Trustpilot
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.