¿Qué son los subtítulos .SRT?
Un archivo .SRT (SubRip Subtitle) es el formato estándar para subtítulos de video. Contiene el texto hablado junto con los timestamps (marcas de tiempo) de cuándo aparece y desaparece cada subtítulo en la pantalla. Es compatible con casi todos los editores de video: Premiere Pro, DaVinci Resolve, CapCut, Final Cut Pro, y plataformas como YouTube.
Así luce un archivo .SRT por dentro:
00:00:01,240 → 00:00:03,120
Hola, bienvenidos al tutorial
2
00:00:03,450 → 00:00:05,800
de extracción de subtítulos
¿Qué es Whisper y por qué es el mejor?
Whisper es el modelo de reconocimiento de voz de OpenAI, publicado como código abierto en 2022. Es considerado uno de los mejores modelos de transcripción disponibles porque:
- Soporta más de 90 idiomas automáticamente
- Es altamente resistente al ruido de fondo
- Ofrece timestamps a nivel de palabra (no solo de oración)
- Funciona bien con distintos acentos y velocidades de habla
- Es completamente gratuito y de código abierto
Paso a paso: extraer subtítulos con ByteCode Insight
Paso 1: Abre la herramienta
Ve a herramientas/subtitulos.html. No necesitas crear cuenta ni instalar nada en tu computador.
Paso 2: Sube tu archivo de audio
Arrastra tu archivo directamente a la zona de carga, o haz clic para seleccionarlo. La herramienta acepta los formatos más comunes:
- MP3 — el más común para música y podcasts
- M4A — grabaciones de iPhone y Mac
- WAV — audio sin comprimir, máxima calidad
- MP4 — también extrae el audio de videos
- OGG, FLAC, AAC — otros formatos soportados
💡 Tip de rendimiento
Para audios muy largos (más de 30 minutos), el modelo Base ofrece un buen equilibrio entre velocidad y precisión. Para conferencias o contenido técnico donde la precisión es crítica, usa Small o Medium.
Paso 3: Elige el modelo Whisper
La herramienta ofrece 5 modelos con diferentes velocidades y precisiones:
- Tiny — el más rápido, ideal para pruebas rápidas o audios con habla clara
- Base — buen equilibrio velocidad/precisión. Recomendado para la mayoría de casos
- Small — más preciso, tarda el doble. Ideal para podcasts o entrevistas
- Medium — alta precisión para contenido con vocabulario técnico o acentos marcados
- Large — máxima precisión disponible, puede tardar varios minutos
Paso 4: Selecciona el idioma (opcional)
Si dejas "Auto-detectar", Whisper identifica el idioma del audio automáticamente. Si conoces el idioma de antemano, especificarlo puede aumentar ligeramente la precisión.
Paso 5: Descarga el archivo .SRT
Una vez completada la transcripción, verás el resumen con el número de palabras y subtítulos generados. Haz clic en "Descargar subtitles.srt" para obtener tu archivo.
¿Cómo importar el .SRT en tu editor de video?
En DaVinci Resolve
Ve a Subtitles → Import Subtitle y selecciona el archivo .SRT. Resolve lo colocará automáticamente en la timeline con los timestamps correctos.
En Adobe Premiere Pro
Ve al panel de Captions, haz clic en los tres puntos y selecciona Import Caption File. Selecciona tu .SRT y Premiere lo convierte a captions editables.
En YouTube
En el panel de YouTube Studio, abre tu video, ve a Subtítulos → Agregar subtítulos → Subir archivo → Con temporización y selecciona el .SRT.
En CapCut
En el editor, toca Texto → Auto subtítulos o importa directamente desde el panel de Subtítulos.
Preguntas frecuentes
¿Mis archivos de audio se guardan en el servidor?
Los archivos se eliminan automáticamente del servidor una vez completada la transcripción. El archivo .SRT generado también se elimina después de que lo descargas.
¿Cuánto tarda la transcripción?
Depende del modelo y la longitud del audio. Con el modelo Base, un audio de 10 minutos tarda aproximadamente 1-3 minutos. El modelo Large puede tardar el triple.
¿Qué tamaño máximo soporta?
La herramienta acepta archivos de hasta 500 MB. Para archivos más grandes, considera comprimir el audio primero o dividirlo en partes.