Trascrivi video MP4 in testo a 2 $/ora
Rilascia il tuo MP4 — estraiamo automaticamente la traccia audio e restituiamo una trascrizione con etichette dei parlanti. Funziona per registrazioni Zoom, registrazioni schermo, lezioni, talk di conferenza e video scaricati. 2 $ all'ora, minimo 2 $.
Estraiamo noi l'audio
Non convertire il tuo MP4 in MP3 prima — carica il video così com'è. Estraiamo la traccia audio lato server e scartiamo il video. La trascrizione viene uguale.
Etichette dei parlanti per riunioni
L'MP4 è il formato dominante per le registrazioni di Zoom, Teams e Meet. Più parlanti? Li separiamo ed etichettiamo ogni segmento.
2 $ all'ora, video o audio
Paghi per durata, non per formato. Una lezione MP4 da 1 ora è 2 $, come un podcast MP3 da 1 ora. Il fatto che ci sia il video non costa di più.
Esportazione SRT per sottotitoli
Ti servono sottotitoli per lo stesso video su YouTube o social? Scarica la trascrizione come SRT e fai il burn-in o caricali sul video — i timestamp sono già allineati.
Dal video MP4 al testo in 3 passi
Carica il tuo MP4
Rilascia il .mp4 nell'area di caricamento. File fino a 500 MB / 10 ore funzionano direttamente. Non serve estrarre l'audio prima né convertire in MP3.
Estraiamo e trascriviamo
La nostra pipeline estrae la traccia audio, la passa attraverso la diarizzazione e la trascrizione Whisper. La maggior parte degli MP4 sotto le 2 ore termina in 4-8 minuti.
Scarica testo o SRT
Copia la trascrizione, esporta come SRT per i sottotitoli video (timestamp già allineati) o scarica come Word. L'MP4 si riproduce accanto al testo.
Formati video, codec e perché MP4 è la scelta sicura
L'MP4 è tecnicamente un contenitore, come uno ZIP per i video. Dentro di solito trovi:
- Stream video: tipicamente H.264 (AVC), sempre più H.265 (HEVC), occasionalmente codec più recenti come AV1. Non ci interessa — buttiamo via il video.
- Stream audio: di solito AAC, occasionalmente AC-3 o MP3. È l'unica parte che conta. La estraiamo, decodifichiamo, trascriviamo.
- Tracce sottotitoli/caption: ignorate. Generiamo le nostre dall'audio.
Non devi estrarre l'audio da solo. Strumenti come Audacity, Handbrake o ffmpeg ti permettono di estrarre un WAV o un MP3 da un MP4 — ma farlo non cambia in alcun modo la trascrizione risultante. Salta il passaggio. Carica direttamente l'MP4.
Un consiglio sulla banda: se il tuo video sorgente è enorme (una registrazione schermo 4K può facilmente toccare 5 GB per 1 ora di file) e ti interessa solo l'audio per la trascrizione, esportare solo l'audio con QuickTime o Audacity ti farà risparmiare tempo di upload. Ma una tipica registrazione Zoom (1080p, 1 ora) atterra sui 200-400 MB e si carica bene così com'è.
Fonti comuni di MP4 e cosa aspettarsi
- Registrazioni cloud di Zoom: 1080p H.264 + AAC. Trascrizioni pulite, le etichette dei parlanti funzionano bene perché Zoom registra ogni partecipante più o meno allo stesso volume. File tipico da 1 ora: 250 MB.
- Registrazioni di Microsoft Teams: archiviate in OneDrive/SharePoint, di solito 720p H.264 + AAC. Stessa precisione di Zoom. Scarica da Stream/SharePoint come MP4.
- Registrazioni cloud di Google Meet: funzione solo Workspace. 720p H.264 + AAC, bitrate leggermente inferiore a Zoom. La precisione dei parlanti è buona ma leggermente meno nitida nel cross-talk.
- Registrazioni schermo da QuickTime / OBS / iPhone: H.264 + AAC. Qualità eccellente. Comuni per walkthrough di prodotto, condivisioni schermo di lezioni, demo software.
- Footage da fotocamera (iPhone, GoPro, DSLR): di solito H.264 o HEVC + AAC. Le registrazioni sul campo spesso hanno vento o rumore di fondo — la precisione dipende dal mic, non dal formato.
- Download da YouTube: strumenti come cobalt o yt-dlp danno MP4. Assicurati di avere il diritto di trascrivere (video tuo o con permesso).
Quanto costa davvero la trascrizione MP4
2 $ per ora di video, indipendentemente da risoluzione o codec. Esempi reali:
$2
Registrazione Zoom da 45 min
$4
Lezione da 2 ore
$10
Talk di conferenza da 5 ore
Minimo 2 $ per file. La risoluzione non conta — trascriviamo solo l'audio.
Frequently asked questions
Devo estrarre l'audio dal mio MP4 prima?+
No. Carica direttamente il .mp4 — estraiamo la traccia audio lato server. Estrarla prima in WAV o MP3 non cambia la trascrizione e aggiunge solo un passaggio.
E se il mio MP4 supera i 500 MB?+
O comprimi prima il video (Handbrake porta una tipica registrazione Zoom 1080p ben sotto i 500 MB), o estrai l'audio in MP3/M4A (QuickTime: File → Esporta come → Solo audio). I file solo audio pesano circa il 5-10 % del video.
Quanto ci mette un MP4 a trascrivere?+
La maggior parte degli MP4 sotto le 2 ore termina in 4-8 minuti. Il passaggio di estrazione aggiunge forse 30 secondi rispetto a partire da MP3. Un MP4 da 4 ore di solito richiede 12-18 minuti.
Otterrò sottotitoli da inserire nel mio video?+
Sì. L'esportazione SRT usa gli stessi timestamp dell'audio sorgente, così puoi allegare il file .srt al tuo MP4 in qualsiasi player o caricarlo come caption su YouTube/Vimeo. Il formato è SubRip standard.
Il codec conta — H.264 vs H.265 vs AV1?+
No. Scartiamo del tutto lo stream video. Finché il file viene riprodotto in un player moderno, la nostra pipeline lo legge. AAC, MP3 e AC-3 sono tutti supportati.
E le registrazioni schermo senza audio parlato?+
Un video silenzioso produce una trascrizione vuota e un rimborso — rimborsiamo automaticamente qualsiasi file in cui la trascrizione fallisce o non trova parlato. Se la registrazione ha solo musica di sottofondo, otterrai output stile rilevamento canzoni, non una trascrizione utile.
La trascrizione integrata di Zoom funziona altrettanto bene?+
La trascrizione integrata di Zoom è decente per essere gratuita, ma manca di precisione sui parlanti nel cross-talk, non supporta oltre 100 lingue e non è disponibile su Zoom gratuito. Se ti servono solo trascrizioni in inglese di riunioni pulite e sei su un piano Zoom a pagamento, l'integrata va bene. Per tutto il resto, caricare un MP4 è la risposta coerente.
Risorse correlate su MP4 e video
Rilascia il tuo MP4 e ottieni una trascrizione
Registrazioni Zoom, lezioni, screen capture — 2 $ all'ora con etichette dei parlanti ed esportazione SRT.
Start transcribingNo card needed to sign up.