Transcreva MP3 para texto por US$ 2/hora
Solte seu arquivo MP3 e receba uma transcrição limpa com identificação de quem fala em menos de 5 minutos. Lidamos com todo bitrate comum — de notas de voz de 64 kbps a podcasts de estúdio em 320 kbps — pela mesma tarifa fixa de US$ 2 por hora.
Qualquer bitrate de MP3
64, 96, 128, 192, 320 kbps — variável ou constante. Sem recodificar, sem ajustar qualidade. Envie o arquivo como está.
Identificação de quem fala inclusa
Vários falantes no seu MP3? Separamos automaticamente. Crucial para episódios de podcast, entrevistas gravadas e reuniões.
US$ 2 por hora, fixo
Seja seu MP3 um recado de 5 minutos ou um catálogo de podcast de 4 horas, a tarifa é US$ 2 por hora de áudio. Mínimo de US$ 2 por arquivo.
Processado na UE
O áudio é processado em data centers da UE e excluído dos nossos servidores 90 dias depois do seu último login. Conforme GDPR por padrão.
De MP3 a texto pesquisável em 3 passos
Envie seu MP3
Arraste seu arquivo .mp3 para a área de envio. Arquivos até 500 MB e 10 horas funcionam direto — sem compressão, sem conversão.
Transcrevemos
Nosso motor detecta o idioma automaticamente (100+ suportados), separa falantes e roda o áudio por um modelo da família Whisper. A maioria dos MP3 abaixo de 2 horas termina em 3-5 minutos.
Baixe a transcrição
Copie como texto puro, exporte como SRT para legendas ou baixe como Word. O áudio toca ao lado do texto para você conferir qualquer linha.
Bitrate, mono vs estéreo e por que MP3 transcreve bem
MP3 é o formato de áudio mais comum do mundo justamente porque faz trade-offs sensatos para fala humana. O formato comprime removendo frequências que nossos ouvidos não detectam de forma confiável — o mesmo truque que deixa modelos de transcrição focarem nas partes do sinal que importam pras palavras. Um MP3 falado a 96 kbps transcreve tão bem quanto a 320 kbps; só dá pra ver ganhos relevantes de precisão com WAV ou FLAC quando a fonte é música ou tem signal-to-noise muito baixo.
Dito isso, duas peculiaridades do MP3 valem conhecer:
- Bitrate variável (VBR) vs constante (CBR): os dois funcionam. Arquivos VBR reportam bitrates inconsistentes para algumas ferramentas, mas nosso pipeline lê as amostras subjacentes, então a precisão é idêntica ao CBR.
- Mono vs estéreo: a maioria dos MP3 de podcast e reunião é mono — ok. Se o seu MP3 é estéreo com um falante hard-panneado em cada canal (setup comum em Zoom ou rig de entrevista), nossa diarização lida com a separação dos dois jeitos; não precisa dividir os canais manualmente.
- Joint stereo: o padrão da maioria dos codificadores. Decodifica idêntico ao estéreo puro para os nossos fins.
Uma coisa que prejudica mais a precisão do que o bitrate: música ou ruído forte de fundo. Se o seu MP3 é um podcast com música de intro constante embaixo das vozes, espere 1-2% menos de precisão que uma gravação de estúdio limpa. O modelo é robusto, não mágico.
De onde vêm os arquivos MP3 (e o que esperar)
A maioria dos MP3 que nossos clientes enviam vem de uma destas fontes, cada uma com características distintas:
- Hosts de podcast (Anchor, Buzzsprout, Libsyn): normalmente 96-128 kbps mono. Sinal limpo, às vezes com música de intro. Transcreve com precisão alta.
- Apps de gravação de voz (Easy Voice Recorder, Smart Recorder): 64-96 kbps mono. Boa precisão de fala, atenção ao ruído de fundo do local de gravação.
- Exportações de DAW (Audacity, GarageBand, Reaper): frequentemente 192-320 kbps estéreo. Maior precisão, arquivos maiores — sem problema, lidamos com até 500 MB.
- Gravações de ligação: tipicamente 32-64 kbps mono com alguns artefatos de compressão. Ainda transcreve bem; identificação de quem fala funciona mesmo em áudio narrowband de telefone.
- Rips de audiolivro ou YouTube: varia. Se o áudio é limpo, a precisão é alta. Se há música em cima da fala (comum em aulas com vinheta), os trechos com música podem gerar texto de baixa confiança — é esperado.
Quanto custa de verdade a transcrição de MP3
US$ 2 por hora de áudio MP3, fixo. Exemplos reais:
$2
Recado de voz de 15 minutos
$4
Episódio de podcast de 2 horas
$10
Catálogo de 5 horas
Mínimo de US$ 2 por arquivo. Sem assinatura. Você paga só pelos MP3 que realmente transcrever.
Frequently asked questions
Quais bitrates de MP3 são suportados?+
Todos — de 32 kbps a 320 kbps, variável ou constante. Bitrates mais baixos (32-64 kbps) às vezes geram precisão um pouco menor porque o áudio fonte tem menos detalhe, mas o formato não nos limita. Lemos as amostras decodificadas direto.
Quanto tempo leva pra transcrever um MP3?+
A maioria dos arquivos MP3 abaixo de 2 horas termina em 3-5 minutos. Um MP3 de 4 horas normalmente leva 8-12 minutos. A página atualiza sozinha — pode fechar a aba e voltar.
Qual o tamanho máximo de arquivo MP3?+
500 MB ou 10 horas de áudio, o que vier primeiro. Um MP3 típico a 128 kbps tem cerca de 1 MB por minuto, então um MP3 de 10 horas a 128 kbps tem uns 75 MB — bem abaixo do limite. MP3 estéreo a 320 kbps são maiores; um arquivo de 5 horas a 320 kbps fica em torno de 720 MB e precisaria ser dividido.
Posso transcrever um MP3 de podcast?+
Sim — podcasts são um dos tipos mais comuns que transcrevemos. A identificação de quem fala é especialmente útil para podcasts no formato entrevista. Música de intro/outro não atrapalha a precisão nas partes faladas.
MP3 com vários falantes recebem identificação?+
Sim. Nosso pipeline inclui diarização automática — a transcrição é dividida em segmentos rotulados Falante A, Falante B, e por aí vai. Você pode renomear no editor depois.
A qualidade do meu MP3 afeta a transcrição?+
Bitrate tem impacto mínimo em áudio falado. O que mais importa é ruído de fundo, falantes cross-talking e sotaque/dialeto. MP3 com qualidade de estúdio alcançam 95%+ de precisão em inglês claro; gravações tipo telefone com ruído de fundo normalmente ficam em 88-92%.
Posso transcrever MP3 com copyright (audiolivro, música)?+
Você só deve enviar arquivos que tem direito de transcrever. Não policiamos o conteúdo, mas também não apoiamos infração de copyright. Para suas próprias gravações, podcasts, aulas e reuniões — pode mandar.
Recursos relacionados de transcrição MP3
M4A para texto
Voice Memos do iPhone usam M4A. Mesmo motor, mesmo US$ 2/h.
WAV para texto
Áudio sem perda para gravações com qualidade de estúdio.
Áudio para texto — guia completo
Como a transcrição com IA funciona por baixo, expectativas de precisão, suporte a formatos.
Preços de transcrição
US$ 2/h explicado, com comparação a serviços por assinatura e por minuto.
Solte seu MP3 e receba uma transcrição
US$ 2 por hora, mínimo de US$ 2, identificação de quem fala inclusa. Sem assinatura.
Start transcribingNo card needed to sign up.