Transcreva vídeo MP4 para texto por US$ 2/hora
Solte seu MP4 — extraímos a faixa de áudio automaticamente e retornamos uma transcrição com identificação de quem fala. Funciona para gravações de Zoom, gravações de tela, aulas, palestras e vídeos baixados. US$ 2 por hora, mínimo de US$ 2.
Nós extraímos o áudio
Não converta seu MP4 para MP3 antes — envie o vídeo como está. A gente puxa a faixa de áudio no servidor e descarta o vídeo. A transcrição sai igual.
Identificação para reuniões
MP4 é o formato dominante para gravações de Zoom, Teams e Meet. Vários falantes? Separamos e identificamos cada segmento.
US$ 2 por hora, vídeo ou áudio
Você paga por duração, não por formato. Uma aula MP4 de 1 hora custa US$ 2, igual a um podcast MP3 de 1 hora. O vídeo estar ali não custa extra.
Exportação SRT para legendas
Precisa de legendas pro mesmo vídeo no YouTube ou redes? Baixe a transcrição como SRT e queime ou suba pro vídeo — os timestamps já estão alinhados.
De vídeo MP4 para texto em 3 passos
Envie seu MP4
Solte o .mp4 na área de envio. Arquivos até 500 MB / 10 horas funcionam direto. Não precisa extrair áudio antes nem converter pra MP3.
Extraímos e transcrevemos
Nosso pipeline puxa a faixa de áudio, passa por diarização e transcrição Whisper. A maioria dos MP4 abaixo de 2 horas termina em 4-8 minutos.
Baixe texto ou SRT
Copie a transcrição, exporte como SRT para legendas de vídeo (timestamps já alinhados) ou baixe como Word. O MP4 toca ao lado do texto.
Formatos de vídeo, codecs e por que MP4 é o padrão seguro
MP4 é tecnicamente um contêiner, tipo ZIP para vídeo. Por dentro, normalmente você acha:
- Faixa de vídeo: tipicamente H.264 (AVC), cada vez mais H.265 (HEVC), ocasionalmente codecs mais novos como AV1. Não importa pra gente — jogamos o vídeo fora.
- Faixa de áudio: normalmente AAC, ocasionalmente AC-3 ou MP3. É a única parte que importa. Extraímos, decodificamos, transcrevemos.
- Faixas de legenda: ignoradas. Geramos as nossas a partir do áudio.
Você não precisa extrair o áudio. Ferramentas como Audacity, Handbrake ou ffmpeg deixam você puxar um WAV ou MP3 de um MP4 — mas isso não muda a transcrição. Pule o passo. Envie o MP4 direto.
Uma dica de banda: se a fonte for enorme (uma gravação de tela em 4K pode chegar fácil a 5 GB em 1 hora), e você só liga pro áudio, exportar só áudio com QuickTime ou Audacity economiza tempo de upload. Mas uma gravação típica de Zoom (1080p, 1 hora) fica em 200-400 MB e sobe sem problema como está.
Fontes comuns de MP4 e o que esperar
- Gravações em nuvem do Zoom: 1080p H.264 + AAC. Transcrições limpas, identificação de quem fala funciona bem porque o Zoom grava cada participante mais ou menos no mesmo volume. Arquivo típico de 1 hora: 250 MB.
- Gravações do Microsoft Teams: ficam no OneDrive/SharePoint, normalmente 720p H.264 + AAC. Mesma precisão do Zoom. Baixe do Stream/SharePoint como MP4.
- Gravações em nuvem do Google Meet: recurso só do Workspace. 720p H.264 + AAC, bitrate um pouco menor que Zoom. Precisão de falante é boa mas um pouco menos nítida em cross-talk.
- Gravações de tela com QuickTime / OBS / iPhone: H.264 + AAC. Excelente qualidade. Comuns para tutoriais de produto, telas compartilhadas de aula, demos de software.
- Material de câmera (iPhone, GoPro, DSLR): normalmente H.264 ou HEVC + AAC. Gravações de campo frequentemente têm vento ou fundo — precisão depende do mic, não do formato.
- Downloads do YouTube: ferramentas como cobalt ou yt-dlp dão MP4. Garanta que você tem direito de transcrever (seu próprio vídeo ou com permissão).
Quanto custa de verdade a transcrição de MP4
US$ 2 por hora de vídeo, independente da resolução ou codec. Exemplos reais:
$2
Gravação de Zoom de 45 min
$4
Aula de 2 horas
$10
Palestras de congresso de 5 horas
Mínimo de US$ 2 por arquivo. Resolução não importa — transcrevemos só o áudio.
Frequently asked questions
Preciso extrair o áudio do MP4 antes?+
Não. Envie o .mp4 direto — puxamos a faixa de áudio no servidor. Pré-extrair para WAV ou MP3 não muda a transcrição e só adiciona um passo.
E se meu MP4 passar de 500 MB?+
Ou comprime o vídeo antes (Handbrake deixa uma gravação típica de Zoom 1080p bem abaixo de 500 MB) ou extrai o áudio para MP3/M4A (QuickTime: Arquivo → Exportar como → Apenas áudio). Arquivos só-áudio pesam aproximadamente 5-10% do vídeo.
Quanto tempo um MP4 leva pra transcrever?+
A maioria dos MP4 abaixo de 2 horas termina em 4-8 minutos. O passo de extração adiciona uns 30 segundos comparado a começar de MP3. Um MP4 de 4 horas normalmente leva 12-18 minutos.
Vou ter legendas que dá pra jogar no meu vídeo?+
Sim. A exportação SRT usa os mesmos timestamps do áudio fonte, então você pode anexar o .srt ao MP4 em qualquer player ou subir como legenda no YouTube/Vimeo. O formato é SubRip padrão.
Codec importa — H.264 vs H.265 vs AV1?+
Não. Descartamos a faixa de vídeo inteira. Enquanto o arquivo tocar em qualquer player moderno, nosso pipeline lê. Áudio AAC, MP3 e AC-3 são todos suportados.
E gravações de tela sem áudio falado?+
Vídeo silencioso produz transcrição vazia e reembolso — reembolsamos automaticamente qualquer arquivo onde a transcrição falhe ou não encontre fala. Se a gravação só tem música de fundo, você vai ter saída tipo detecção de música, não transcrição útil.
A transcrição embutida do Zoom funciona igual?+
A transcrição embutida do Zoom é decente pra algo grátis, mas falta precisão na identificação em cross-talk, não suporta 100+ idiomas e não existe no Zoom grátis. Se você só precisa de transcrição em inglês de reuniões limpas e está em plano pago, a embutida basta. Pra todo o resto, enviar o MP4 é a resposta consistente.
Recursos relacionados de MP4 e vídeo
Solte seu MP4 e receba uma transcrição
Gravações de Zoom, aulas, capturas de tela — US$ 2 por hora com identificação de quem fala e exportação SRT.
Start transcribingNo card needed to sign up.