Design de interface por voz é desenhar a interação que acontece pela fala. O desafio é que não dá pra assumir reconhecimento perfeito nem uma conversa em linha reta, porque as pessoas falam de jeitos diferentes, hesitam, se corrigem e erram.
O erro comum é tratar voz como uma interface visual apenas narrada. Acontece que o áudio tem restrição própria: a pessoa não tem botão na frente nem hierarquia visual pra se orientar, e a memória de curto prazo limita quanto a interface pode falar de uma vez.
Por isso o foco vai pra recuperação de erro e flexibilidade. A interface precisa antecipar a fala torta, oferecer caminho pra corrigir ou reformular, e confirmar a ação por áudio. Como bônus, a voz também abre o uso sem as mãos, o que ajuda quando a pessoa está dirigindo ou com as mãos ocupadas.