¿Qué son los subtítulos .SRT?

Un archivo .SRT (SubRip Subtitle) es el formato estándar para subtítulos de video. Contiene el texto hablado junto con los timestamps (marcas de tiempo) de cuándo aparece y desaparece cada subtítulo en la pantalla. Es compatible con casi todos los editores de video: Premiere Pro, DaVinci Resolve, CapCut, Final Cut Pro, y plataformas como YouTube.

Así luce un archivo .SRT por dentro:

subtitles.srt

1
00:00:01,240 → 00:00:03,120
Hola, bienvenidos al tutorial

2
00:00:03,450 → 00:00:05,800
de extracción de subtítulos

¿Qué es Whisper y por qué es el mejor?

Whisper es el modelo de reconocimiento de voz de OpenAI, publicado como código abierto en 2022. Es considerado uno de los mejores modelos de transcripción disponibles porque:

Soporta más de 90 idiomas automáticamente
Es altamente resistente al ruido de fondo
Ofrece timestamps a nivel de palabra (no solo de oración)
Funciona bien con distintos acentos y velocidades de habla
Es completamente gratuito y de código abierto

Paso a paso: extraer subtítulos con ByteCode Insight

Paso 1: Abre la herramienta

Ve a herramientas/subtitulos.html. No necesitas crear cuenta ni instalar nada en tu computador.

Paso 2: Sube tu archivo de audio

Arrastra tu archivo directamente a la zona de carga, o haz clic para seleccionarlo. La herramienta acepta los formatos más comunes:

MP3 — el más común para música y podcasts
M4A — grabaciones de iPhone y Mac
WAV — audio sin comprimir, máxima calidad
MP4 — también extrae el audio de videos
OGG, FLAC, AAC — otros formatos soportados

💡 Tip de rendimiento

Para audios muy largos (más de 30 minutos), el modelo Base ofrece un buen equilibrio entre velocidad y precisión. Para conferencias o contenido técnico donde la precisión es crítica, usa Small o Medium.

Paso 3: Elige el modelo Whisper

La herramienta ofrece 5 modelos con diferentes velocidades y precisiones:

Tiny — el más rápido, ideal para pruebas rápidas o audios con habla clara
Base — buen equilibrio velocidad/precisión. Recomendado para la mayoría de casos
Small — más preciso, tarda el doble. Ideal para podcasts o entrevistas
Medium — alta precisión para contenido con vocabulario técnico o acentos marcados
Large — máxima precisión disponible, puede tardar varios minutos

Paso 4: Selecciona el idioma (opcional)

Si dejas "Auto-detectar", Whisper identifica el idioma del audio automáticamente. Si conoces el idioma de antemano, especificarlo puede aumentar ligeramente la precisión.

Paso 5: Descarga el archivo .SRT

Una vez completada la transcripción, verás el resumen con el número de palabras y subtítulos generados. Haz clic en "Descargar subtitles.srt" para obtener tu archivo.

¿Cómo importar el .SRT en tu editor de video?

En DaVinci Resolve

Ve a Subtitles → Import Subtitle y selecciona el archivo .SRT. Resolve lo colocará automáticamente en la timeline con los timestamps correctos.

En Adobe Premiere Pro

Ve al panel de Captions, haz clic en los tres puntos y selecciona Import Caption File. Selecciona tu .SRT y Premiere lo convierte a captions editables.

En YouTube

En el panel de YouTube Studio, abre tu video, ve a Subtítulos → Agregar subtítulos → Subir archivo → Con temporización y selecciona el .SRT.

En CapCut

En el editor, toca Texto → Auto subtítulos o importa directamente desde el panel de Subtítulos.

Preguntas frecuentes

¿Mis archivos de audio se guardan en el servidor?

Los archivos se eliminan automáticamente del servidor una vez completada la transcripción. El archivo .SRT generado también se elimina después de que lo descargas.

¿Cuánto tarda la transcripción?

Depende del modelo y la longitud del audio. Con el modelo Base, un audio de 10 minutos tarda aproximadamente 1-3 minutos. El modelo Large puede tardar el triple.

¿Qué tamaño máximo soporta?

La herramienta acepta archivos de hasta 500 MB. Para archivos más grandes, considera comprimir el audio primero o dividirlo en partes.

Cómo extraer subtítulos de un audio automáticamente con IA