Banco de dados vetorial

Um banco feito para guardar embeddings e achar rápido os itens mais parecidos em significado com o que você busca.

Hard

O que é

Banco de dados vetorial é um tipo de banco desenhado para armazenar embeddings e responder a pergunta encontre os itens mais próximos deste de forma rápida, mesmo com milhões de registros. Em vez de buscar por igualdade exata, ele busca por proximidade no espaço de significado.

É a infraestrutura que sustenta busca semântica e RAG. Quando uma feature de IA precisa recuperar os trechos mais relevantes de uma base para responder, é o banco vetorial que faz esse achado em tempo de resposta. Sem ele, recuperar por significado em escala seria lento demais.

Para quem faz produto, não é preciso saber implementar, mas vale entender que essa peça existe e que ela define velocidade e qualidade da recuperação. Quando a busca semântica está lenta ou trazendo resultado ruim, parte da explicação pode estar em como esse banco foi montado e indexado.

Em uma frase

A recuperação está lenta, vale revisar como o banco vetorial está indexado.

A pergunta que ele responde

Onde fica guardada a informação que a IA recupera para responder com base nos meus dados?

Quando usar

Quando o produto precisa de busca semântica ou recuperação por significado em escala, como em RAG.

Como não usar

Usar para tudo. Para busca exata por id, filtro ou valor, o banco tradicional resolve melhor e mais barato.

Na prática

A documentação inteira da empresa vira embeddings guardados num banco vetorial, e o assistente recupera de lá os trechos certos para cada pergunta.

Não confunda com

Banco de dados vetorial não é banco relacional: o relacional busca por valor exato em tabelas, o vetorial busca por proximidade de significado entre vetores.

Em inglês

Vector Database

Pronúncia

véc-tor data-beis

Também chamado de

vector database, vector store, banco vetorial

Origem

n/a

Fonte

Saiba mais

Pinecone, materiais introdutórios sobre bancos de dados vetoriais