Transcribe MP3 a texto por 2 $/hora
Suelta tu archivo MP3 y obtén una transcripción limpia con etiquetas de hablante en menos de 5 minutos. Manejamos todos los bitrates comunes — desde notas de voz de 64 kbps hasta podcasts de estudio a 320 kbps — a la misma tarifa plana de 2 $ por hora.
Cualquier bitrate MP3
64, 96, 128, 192, 320 kbps — variable o constante. Sin recodificación, sin ajustes de calidad. Sube el archivo tal cual.
Etiquetas de hablante incluidas
¿Varios hablantes en tu MP3? Los separamos automáticamente. Crucial para episodios de podcast, entrevistas y grabaciones de reuniones.
2 $ por hora, plano
Ya sea tu MP3 un mensaje de voz de 5 minutos o un catálogo de podcast de 4 horas, la tarifa es 2 $ por hora de audio. Mínimo de 2 $ por archivo.
Procesado en la UE
El audio se procesa en centros de datos UE y se elimina 90 días después de tu último acceso. Conforme al RGPD por defecto.
De MP3 a texto buscable en 3 pasos
Sube tu MP3
Arrastra tu archivo .mp3 al área de subida. Funcionan archivos de hasta 500 MB y 10 horas — sin compresión, sin conversión.
Transcribimos
Nuestro motor detecta el idioma automáticamente (más de 100 soportados), separa hablantes y pasa el audio por un modelo de la familia Whisper. La mayoría de MP3 de menos de 2 horas terminan en 3-5 minutos.
Descarga la transcripción
Copia como texto plano, exporta como SRT para subtítulos o descarga como Word. El audio se reproduce junto al texto para que verifiques cualquier línea.
Bitrate, mono vs estéreo y por qué MP3 transcribe bien
MP3 es el formato de audio más común del mundo precisamente porque hace compromisos sensatos para la voz humana. El formato comprime quitando frecuencias que nuestros oídos no detectan fiablemente — el mismo truco que permite a los modelos de transcripción centrarse en las partes de la señal que importan para las palabras. Un MP3 de voz a 96 kbps transcribe igual que uno a 320 kbps; solo se ven ganancias significativas con WAV o FLAC cuando la fuente es música o tiene una relación señal-ruido muy baja.
Dicho eso, dos peculiaridades del MP3 vale la pena conocerlas:
- Bitrate variable (VBR) vs constante (CBR): ambos funcionan. Los archivos VBR reportan bitrates inconsistentes a algunas herramientas pero nuestro pipeline lee las muestras subyacentes, así que la precisión es idéntica al CBR.
- Mono vs estéreo: la mayoría de MP3 de podcast y reuniones son mono — bien. Si tu MP3 es estéreo con un hablante panneado fuerte a cada canal (común en Zoom o equipos de entrevista), nuestra diarización maneja la separación de cualquier forma; no hace falta dividir manualmente los canales.
- Estéreo conjunto: el predeterminado en la mayoría de codificadores. Decodifica idéntico al estéreo verdadero para nuestros fines.
Una cosa que sí afecta a la precisión más que el bitrate: música o ruido fuerte de fondo. Si tu MP3 es un podcast con música de intro constante bajo las voces, espera 1-2 % menos de precisión que una grabación de estudio limpia. El modelo de transcripción es robusto, no mágico.
De dónde vienen los archivos MP3 (y qué esperar)
La mayoría de los MP3 que nuestros clientes suben vienen de una de estas fuentes, cada una con características distintas:
- Hostings de podcast (Anchor, Buzzsprout, Libsyn): normalmente 96-128 kbps mono. Señal limpia, a veces música de intro. Transcribe con mucha precisión.
- Apps de grabación de voz (Easy Voice Recorder, Smart Recorder): 64-96 kbps mono. Buena precisión en voz, cuidado con el ruido de fondo del lugar de grabación.
- Exportaciones de DAW (Audacity, GarageBand, Reaper): a menudo 192-320 kbps estéreo. Máxima precisión, archivos más grandes — está bien, manejamos hasta 500 MB.
- Grabaciones de llamadas: típicamente 32-64 kbps mono con algunos artefactos de compresión. Aun así transcribe bien; las etiquetas de hablante funcionan incluso con audio de banda estrecha de teléfono.
- Rips de audiolibro o YouTube: variable. Si el audio es limpio, la precisión es alta. Si hay música encima de la voz (común en clases con ráfagas de intro), las partes con música pueden producir texto de baja confianza — es lo esperado.
Lo que cuesta de verdad la transcripción de MP3
2 $ por hora de audio MP3, plano. Ejemplos reales:
$2
Nota de voz de 15 minutos
$4
Episodio de podcast de 2 horas
$10
Catálogo de 5 horas
Mínimo de 2 $ por archivo. Sin suscripción. Pagas solo por los MP3 que realmente transcribas.
Frequently asked questions
¿Qué bitrates de MP3 se admiten?+
Todos — de 32 kbps a 320 kbps, variable o constante. Los bitrates bajos (32-64 kbps) a veces producen ligeramente menos precisión porque el audio fuente tiene menos detalle, pero el formato no nos limita. Leemos las muestras decodificadas directamente.
¿Cuánto tarda en transcribirse un MP3?+
La mayoría de archivos MP3 de menos de 2 horas terminan en 3-5 minutos. Un MP3 de 4 horas suele tardar 8-12 minutos. La página se actualiza automáticamente — puedes cerrar la pestaña y volver.
¿Cuál es el tamaño máximo de archivo MP3?+
500 MB o 10 horas de audio, lo que llegue primero. Un MP3 típico a 128 kbps pesa unos 1 MB por minuto, así que un MP3 de 10 horas a 128 kbps son unos 75 MB — muy por debajo del límite. Los MP3 estéreo a 320 kbps son más grandes; un archivo de 5 horas a 320 kbps ronda los 720 MB y habría que dividirlo.
¿Puedo transcribir un MP3 de podcast?+
Sí — los podcasts son uno de los tipos de archivo más comunes que transcribimos. La función de etiquetas de hablante es especialmente útil para podcasts en formato entrevista. La música de intro/outro no afecta a la precisión en las partes habladas.
¿Los MP3 con varios hablantes reciben etiquetas?+
Sí. Nuestro pipeline incluye diarización automática — la transcripción se divide en segmentos etiquetados Hablante A, Hablante B, etc. Puedes renombrar hablantes en el editor después.
¿La calidad de mi MP3 afecta a la transcripción?+
El bitrate tiene un impacto mínimo en audio de voz. Lo que importa más es el ruido de fondo, los hablantes solapados y el acento/dialecto. Los MP3 de calidad estudio alcanzan 95 %+ de precisión en inglés claro; las grabaciones tipo teléfono con ruido suelen rondar 88-92 %.
¿Puedo transcribir un MP3 con derechos de autor (audiolibro, música)?+
Solo deberías subir archivos que tengas derecho a transcribir. No controlamos el contenido pero tampoco fomentamos la infracción de copyright. Para tus propias grabaciones, podcasts, clases y reuniones — adelante.
Recursos relacionados sobre MP3
M4A a texto
Las notas de voz del iPhone se guardan como M4A. Mismo motor, mismos 2 $/h.
WAV a texto
Audio sin pérdida para grabaciones de calidad estudio.
Audio a texto — guía completa
Cómo funciona la transcripción IA por dentro, expectativas de precisión, formatos.
Precios de transcripción
2 $/h explicado, con comparativa de suscripción y servicios por minuto.
Suelta tu MP3 y obtén una transcripción
2 $ por hora, mínimo 2 $, etiquetas de hablante incluidas. Sin suscripción.
Start transcribingNo card needed to sign up.
See also
MP4 a texto
Mismo motor para archivos de video — extraemos el audio automáticamente.
Nota de voz a texto
Flujo de notas de voz del iPhone.
Ver una transcripción de ejemplo
Salida real con etiquetas de hablante y marcas de tiempo.
Comparar servicios de transcripción
TranscribeCat vs Otter, Rev, Sonix y otros.