Una base de dades vectorial és un sistema especialitzat que emmagatzema i gestiona dades convertides en vectors (seqüències de números) utilitzant
embeddings. A diferència de les bases de dades tradicionals que busquen coincidències exactes, aquestes poden trobar elements similars encara que no siguin idèntics.
Els
embeddings són la peça clau d'aquestes bases de dades: transformen dades complexes com textos, imatges o sons en vectors matemàtics que capturen el seu significat i relacions. Per exemple, en un
embedding de paraules, termes com "rei" i "monarca" estaran representats per vectors molt similars, la qual cosa permet al sistema trobar connexions semàntiques més enllà de la coincidència literal de paraules.
Les bases de dades vectorials són fonamentals per a molts
sistemes d'IA. Quan un sistema de cerca necessita trobar informació relacionada, utilitza aquests
embeddings per comparar vectors i recuperar continguts conceptualment similars. Això s'aplica en sistemes de recomanació, cerca semàntica, anàlisi de documents i moltes altres aplicacions on interessa trobar similituds més profundes que les simples coincidències textuals.