Token (de IA)

A menor unidade em que o modelo de IA quebra o texto para processar, e a base do custo e do limite de contexto.

Hard

O que é

Token é o pedaço em que o modelo de linguagem divide o texto para processar. Pode ser uma palavra inteira, parte de uma palavra ou um sinal. O modelo não lê letras nem frases como a gente: ele lê sequências de tokens e prevê o próximo. Tudo que entra e sai vira token nos bastidores.

Isso importa por dois motivos práticos: custo e limite. O preço de usar um modelo costuma ser contado por token, então texto mais longo custa mais. E a janela de contexto, o quanto o modelo aguarda de uma vez, também é medida em tokens. Saber disso ajuda a entender por que respostas longas saem mais caras e por que documentos grandes estouram o limite.

É um conceito mais técnico, e nem todo mundo de produto precisa dominar o detalhe. Mas entender que existe uma unidade de custo e de limite por trás de cada interação evita surpresas na conta e ajuda a desenhar features que não esbarram no teto sem aviso.

Em uma frase

Essa resposta gigante está gastando muito token, vamos limitar o tamanho para segurar o custo.

A pergunta que ele responde

Por que usar IA fica mais caro quando o texto é mais longo?

Quando usar

Ao estimar custo de uma feature de IA e ao dimensionar o que cabe na janela de contexto.

Como não usar

Ignorar a contagem de tokens ao planejar custo. Texto longo demais infla a conta e pode estourar o limite.

Na prática

A conta da feature de IA sobe mais que o esperado. O time descobre que as respostas longas estão gastando muitos tokens por uso.

Não confunda com

Token de IA não é a mesma coisa que design token: o token de IA é a unidade de texto que o modelo processa, o design token é um valor de estilo guardado num design system.

Em inglês

Token

Pronúncia

tô-ken

Também chamado de

token, tokens, unidade de texto

Origem

n/a

Fonte

Saiba mais

Anthropic, documentação sobre tokens e contagem em modelos