Existem momentos em que digitar é mais lento do que pensar. Uma ideia surge, você começa a escrever, perde o fio. Ou você simplesmente está cansado do teclado depois de horas de trabalho.

Há ferramentas pagas de ditado por voz — a mais conhecida é o Wispr Flow. Mas elas cobram mensalidade, e eu queria entender como funcionavam por dentro. Então construí a minha própria versão: o not-wisprflow.

O que é

O not-wisprflow é uma ferramenta de ditado por voz para Windows. O funcionamento é simples:

  1. Você pressiona Ctrl+Shift+Espaço;
  2. Fala o que quer escrever;
  3. Pressiona o atalho de novo (ou solta, se estiver segurando);
  4. O texto aparece onde o cursor está — no Word, no navegador, no Slack, em qualquer lugar.

Não é uma transcrição bruta. A ferramenta passa o texto por uma IA que remove vícios de linguagem, corrige pontuação e deixa o resultado limpo antes de colar.

Por que construí

Queria duas coisas: entender como ferramentas de ditado funcionam por baixo dos panos, e ter uma versão que eu controlasse completamente — sem planos, sem limites de uso, sem depender de uma empresa terceira para continuar funcionando.

O custo de rodar a ferramenta é basicamente zero: a API do Groq que ela usa tem um nível gratuito generoso, e os modelos Whisper são rápidos o suficiente para a transcrição parecer instantânea.

Como funciona

  • Gravação — o microfone captura o áudio em tempo real;
  • Detecção de silêncio — a ferramenta identifica quando você parou de falar e divide o áudio em pedaços menores;
  • Transcrição — cada pedaço é enviado para o Whisper (via Groq) em paralelo, o que torna o processo muito mais rápido;
  • Limpeza — um modelo de linguagem remove repetições, "ãns" e "éns", e adiciona pontuação adequada.

O resultado é colado automaticamente onde o cursor está, usando o atalho Ctrl+V do próprio sistema.

Status atual

A ferramenta funciona no Windows 10 e 11, com Python instalado. Está em uso diário no meu computador. É um projeto pessoal sem interface gráfica — você configura pelo arquivo .env e roda pelo terminal. No futuro, pretendo empacotar em um executável para facilitar a instalação.

Tem alguma dúvida sobre como montar uma ferramenta parecida? Me escreva em contato@gabrielmaciel.com.br.