Una xarxa neuronal és un tipus de disseny d'
intel·ligència artificial inspirat en el funcionament del cervell humà. És com una xarxa de nodes interconnectats que aprèn a reconèixer
patrons i resoldre problemes processant informació a través de diferents capes.
Imagina un
model d'IA com una fàbrica amb el seu sistema de treball (xarxa neuronal) compost per diversos departaments (capes). En cada departament hi ha múltiples treballadors (nodes) especialitzats en diferents aspectes d'una mateixa tasca. La informació passa per aquests departaments, sent processada de forma cada cop més complexa, segons les normes (
paràmetres) que el sistema de treball ha après de la seva experiència prèvia (
entrenament).
Per exemple, en una xarxa neuronal que reconeix imatges de gossos, el primer departament té treballadors especialitzats a detectar vores, línies i corbes bàsiques. El departament següent té altres treballadors que combinen aquestes característiques per identificar formes més complexes com ulls o potes. El departament final té treballadors que analitzen totes aquestes característiques juntes per determinar si la imatge és o no un gos.
Durant l'
entrenament, la xarxa ajusta els seus
paràmetres, millorant gradualment la seva precisió en la tasca. Això permet que la xarxa pugui reconèixer gossos en diferents contextos, mides i posicions, no només aquells amb els quals va ser entrenada inicialment.
Les xarxes neuronals s'organitzen en diferents tipus especialitzats, com les Convolucionals (CNN) per al processament d'imatges i les Recurrents (RNN) per a dades seqüencials. Aquestes es combinen de diferents formes creant arquitectures més complexes com els
Transformers, base de pràcticament tots els models de llenguatge moderns (GPT, Claude, Gemini, Llama, etc.), o els
Models de Difusió, dominants en generació d'imatges (Stable Diffusion, DALL-E, Midjourney).