Transcreva WAV para texto por US$ 2/hora
Gravações WAV com qualidade de estúdio — exportações de DAW, entrevistas com vários microfones, depoimentos, áudio de arquivo — transcritas com identificação de quem fala em menos de 5 minutos na maioria dos arquivos. US$ 2 por hora, sem assinatura.
Áudio sem perda na entrada
Envie WAV PCM não comprimido em qualquer sample rate ou bit depth (16-bit, 24-bit, 32-bit float — tudo aceito). Não recomprimimos; o modelo recebe o sinal com a maior qualidade possível.
Diarização de falantes
Gravações multipista, entrevistas em painel, depoimentos — identificamos e rotulamos cada falante automaticamente, mesmo com fala sobreposta.
US$ 2 por hora, fixo
Uma gravação de estúdio de 4 horas custa o mesmo que um MP3 de 4 horas: US$ 2 por hora. Áudio sem perda não custa mais, mesmo que os arquivos sejam 10× o tamanho do MP3.
Até 500 MB / 10 horas
Um WAV de 4 horas em 24-bit/48 kHz estéreo tem cerca de 2,4 GB e não cabe. Converta para FLAC (também sem perda) ou divida a sessão — 10 horas de WAV 16-bit/16 kHz mono têm cerca de 1,1 GB.
De arquivo WAV a transcrição limpa em 3 passos
Envie seu WAV
Solte o arquivo .wav na área de envio. Mono ou estéreo, qualquer sample rate, qualquer bit depth comum. Sem conversão.
Transcrevemos
Arquivos WAV são decodificados direto — pulamos o passo de decode com perda, o que significa zero artefatos de codificador na entrada. A maioria dos WAVs abaixo de 2 horas termina em 4-7 minutos.
Receba uma transcrição verbatim
Entrada sem perda significa a maior precisão que nosso pipeline produz. Copie como texto, exporte como SRT ou baixe como documento Word com identificação de quem fala.
Por que profissionais escolhem WAV (e quando MP3 basta)
WAV é áudio não comprimido — a forma de onda crua armazenada amostra por amostra num contêiner simples. Um WAV estéreo de 1 hora a 44,1 kHz / 16-bit (qualidade de CD) tem cerca de 600 MB; a 48 kHz / 24-bit (padrão de broadcast) são ~1 GB por hora. Os arquivos são enormes porque não tem compressão — cada amostra é preservada exatamente como o microfone capturou.
Para transcrição especificamente, WAV produz resultados marginalmente melhores que MP3 em três casos:
- Configurações multi-microfone onde cada falante tem o próprio canal. Podemos usar a separação de canal para melhorar a diarização.
- Níveis de sinal muito baixos (fala sussurrada, microfone distante), onde a compressão MP3 descarta detalhe que ajuda o modelo.
- Ruído ou música forte de fundo, onde o range dinâmico extra do WAV dá ao modelo mais material para separar.
Para tudo o mais — podcasts limpos, gravações de um único falante, áudio normal de reunião — um MP3 a 192 kbps transcreve com menos de 1% de diferença em relação ao WAV. Se a diferença entre 96% e 97% de precisão importa, use WAV. Caso contrário, o armazenamento extra é desperdiçado num fluxo de transcrição.
De onde vêm os arquivos WAV em fluxos reais
- DAWs pro (Pro Tools, Logic, Reaper, Audacity): WAV é a exportação padrão para masters de arquivo. Sessões normalmente são 24-bit / 48 kHz. Aceitamos como estão.
- Gravadores de campo (Zoom H5/H6, Tascam DR-40, Sound Devices MixPre): gravam direto em WAV. Gravações multi-mic de campo frequentemente produzem arquivos WAV de 4 ou 8 trilhas — tudo bem; somamos para mono internamente para transcrever.
- Sistemas de broadcast e arquivamento: BBC, NPR, taquígrafos de tribunal e muitos contextos jurídicos/médicos exigem WAV (ou BWF — Broadcast WAV — que lemos do mesmo jeito) porque compressão com perda é considerada questão de cadeia de custódia.
- Dublagem e ADR: WAV preserva o take exatamente como foi gravado para edição posterior.
- Apps antigos de gravação do Windows: ainda usam WAV por padrão. Se você tem uma gravação de uma década atrás, provavelmente é WAV.
Dica para sessões muito longas: se você tem um WAV de depoimento de 5 horas em 24-bit/48 kHz com 5+ GB, converta primeiro para FLAC. FLAC também é sem perda, transcreve idêntico ao WAV e normalmente reduz o tamanho à metade. Aceitamos FLAC direto.
Quanto custa de verdade a transcrição WAV
US$ 2 por hora, sem importar bit depth ou sample rate. Exemplos reais:
$2
WAV de entrevista de 30 min
$8
Sessão de estúdio de 4 horas
$20
Depoimento de 10 horas
Áudio sem perda não custa mais. WAVs são maiores, mas a transcrição é cobrada por duração, não por tamanho.
Frequently asked questions
Quais bit depths e sample rates de WAV são suportados?+
Todos os comuns: 16-bit, 24-bit, 32-bit inteiro e 32-bit float. Sample rates de 8 kHz (telefone legado) até 192 kHz (high-res) decodificam. Resampleamos internamente para transcrever.
Uma transcrição WAV vai ser mais precisa que o mesmo áudio em MP3?+
Marginalmente — tipicamente <1% de diferença para áudio falado limpo. Casos em que WAV ganha de fato: gravações multi-mic, áudio de nível baixo e ruído forte de fundo. Para áudio normal de reunião/entrevista, MP3 a 192 kbps é essencialmente idêntico.
Meu WAV tem 4 GB e não sobe — e agora?+
Converta para FLAC (também sem perda, muito menor) usando Audacity, ffmpeg ou qualquer ferramenta pro de áudio. Um WAV típico de 4 GB vira FLAC de 1,5-2 GB sem perda de qualidade. Ou divida a sessão em duas partes numa pausa natural. Nossos limites são 500 MB e 10 horas por arquivo.
Vocês lidam com WAV multipista (BWF, multicanal)?+
Sim. Arquivos WAV multicanal (4 trilhas, 8 trilhas) são decodificados e somados para mono antes da transcrição. Ainda não usamos rótulos de canal individual para diarizar — a identificação de quem fala ainda roda no áudio somado. Diarização multicanal está no roadmap.
Arquivos BWF (Broadcast WAV) são suportados?+
Sim — BWF é só WAV com metadados extras num chunk "bext". Ignoramos os metadados e decodificamos o áudio como WAV padrão. Timecode e metadados do gravador são preservados no nosso backend mas ainda não aparecem no editor.
Consigo timestamps por palavra de um WAV?+
Atualmente fornecemos timestamps por segmento (frase) na transcrição e exportação SRT. Timestamps por palavra estão no roadmap. O formato de partida — WAV vs MP3 — não muda a saída.
Para uso de taquígrafo ou depoimento jurídico, WAV é preferido?+
Muitos fluxos jurídicos exigem áudio sem perda para o arquivo master. Envie o WAV direto — sem passo de transcodificação na cadeia de custódia. Observação: TranscribeCat não é certificado para uso judicial; a transcrição IA deve ser revisada por humano antes do uso oficial.
Recursos relacionados WAV e áudio pro
MP3 para texto
Quando MP3 basta (a maioria) e quando WAV ganha.
Para jurídico
Transcrição de depoimentos e confidencialidade.
Para jornalismo
Transcrição de entrevista com várias fontes e identificação de quem fala.
Melhore a precisão da transcrição
Posicionamento de microfone, ruído de fundo e o que realmente move a precisão.
Solte seu WAV e receba uma transcrição limpa
Áudio de estúdio entra, texto com identificação de quem fala sai. US$ 2 por hora sem artefatos de compressão.
Start transcribingNo card needed to sign up.