Janela de contexto

O limite de quanto texto o modelo de IA consegue considerar de uma vez em uma conversa ou tarefa.

Hard

O que é

Janela de contexto é o tamanho máximo de informação que um modelo de linguagem consegue ter em mente ao mesmo tempo, contado em tokens. Tudo que entra na conversa, o que você pediu, o que ele já respondeu, os documentos que você colou, ocupa essa janela. Quando estoura, o começo escapa.

Isso é um limite operacional que molda o que dá para construir. Uma janela pequena obriga a resumir, cortar ou recuperar trechos sob demanda, como no RAG. Uma janela grande permite jogar muito material de uma vez, mas custa mais caro e nem sempre o modelo presta atenção igual em tudo que está lá dentro.

Para quem faz produto, entender a janela de contexto evita promessas que o sistema não cumpre. Aquela feature que deveria ler o documento inteiro pode estar, na verdade, vendo só um pedaço. Saber o limite explica comportamentos estranhos e orienta o desenho da solução.

Em uma frase

Esse documento não cabe na janela de contexto, vamos ter que recuperar só os trechos relevantes.

A pergunta que ele responde

Por que a IA esquece o que eu disse no começo da conversa?

Quando usar

Ao desenhar features que processam textos longos, conversas extensas ou muitos documentos de uma vez.

Como não usar

Assumir que o modelo lê tudo que você jogou nele. Acima do limite, parte do material é simplesmente ignorada.

Na prática

O chatbot esquece o que foi dito no início de uma conversa longa. Não é bug: a janela de contexto encheu e o começo saiu.

Não confunda com

Janela de contexto não é memória permanente: ela vale dentro de uma sessão e some quando a conversa termina, não guarda nada entre usos a menos que você construa isso por fora.

Em inglês

Context Window

Pronúncia

cón-tékst uín-dou

Também chamado de

context window, contexto do modelo, memória de contexto

Origem

n/a

Fonte

Saiba mais

Anthropic, documentação técnica sobre tokens e context window