Vibe Voice — Transcripción Gratis con Microsoft + Claude
Microsoft y Claude acaban de matar cualquier app de transcripción. Transcribe cualquier audio o video gratis en 50+ idiomas con identificación de hablantes — y Claude lo convierte en resumen, guion o documento.
microsoft/VibeVoice
Repositorio oficial en GitHub — código abierto, gratis
50+
idiomas
60 min
de audio por pasada
38k+
likes en GitHub
Gratis
código abierto
01 qué es
¿Qué es Vibe Voice?
Vibe Voice es un sistema de IA de voz de código abierto creado por Microsoft. Maneja reconocimiento de voz (ASR) y síntesis de voz (TTS) con modelos que operan a velocidades ultra-bajas para máxima calidad.
Lo que nos importa a nosotros: la parte de transcripción automática. Le avientas cualquier audio o video — una junta, un podcast, un video de TikTok, una llamada de ventas — y te saca el texto completo con identificación de quién dijo qué, timestamps, y soporte para más de 50 idiomas.
Y lo mejor: corre en tu computadora, es gratis, y no necesitas pagar ninguna suscripción.
02 el combo
¿Cómo Funciona el Combo?
Son tres pasos. Instala, transcribe, y pásale el texto a Claude para que lo convierta en lo que necesites:
Instala Vibe Voice
Dale el link de GitHub a Claude y dile que lo instale por ti — él se encarga de todo
Transcribe
Aviéntale cualquier audio, video o junta en cualquier idioma — te saca texto con nombres de hablantes y timestamps
Procesa con Claude
Agarra el texto y pásaselo a Claude — resumen, guion viral, análisis, documento, lo que necesites
03 instálalo con claude
Pégale Este Prompt a Claude
La forma más fácil: copia este prompt, pégalo en Claude Code, y él se encarga de leer el repositorio e instalar todo por ti.
Prompt de instalación automática
Pega esto en Claude Code y deja que él haga el trabajo
Ve al repositorio de Vibe Voice en GitHub: https://github.com/microsoft/VibeVoice Lee el README completo y luego instálame Vibe Voice paso a paso. Quiero poder transcribir cualquier audio o video desde mi computadora — juntas, podcasts, videos de competencia, llamadas de ventas, lo que sea. Configura todo para que funcione localmente y explícame qué vas haciendo en cada paso.
04 procesa la transcripción
Después de Transcribir, Pásale Esto a Claude
Ya que Vibe Voice te dé la transcripción, cópiala y usa este prompt para que Claude la convierta en algo útil:
Prompt de procesamiento
Pega la transcripción y Claude te arma el documento
Acabo de transcribir un audio/video con Vibe Voice. Aquí está la transcripción: [PEGA LA TRANSCRIPCIÓN AQUÍ] Necesito que: 1. Identifiques quién dijo qué (por hablante) 2. Me hagas un resumen ejecutivo de los puntos clave 3. Listes las acciones pendientes o decisiones tomadas 4. Si hay algo que requiere seguimiento, márcalo claro Formato: limpio, con secciones, listo para compartir.
05 para qué sirve
Casos de Uso
Este combo aplica para mucho más que juntas. Aquí algunos ejemplos:
Juntas de trabajo
Graba tu junta → transcribe → Claude te arma resumen con acciones pendientes
Videos de competencia
Mete el video de tu competencia → texto → Claude te explica por qué se hizo viral
Llamadas de ventas
Graba la llamada → transcribe → Claude saca insights y objeciones del cliente
Contenido en otro idioma
Audio en inglés, portugués, lo que sea → texto transcrito y listo para traducir
microsoft/VibeVoice
Repositorio oficial en GitHub — código abierto, gratis
Este combo mata cualquier app de transcripción.
Gratis, código abierto, 50+ idiomas, y Claude convierte el texto en lo que necesites. Comenta qué tipo de audios o contenido vas a usar con esta automatización.