Vibe Voice — Transcripción Gratis con Microsoft + Claude

Microsoft y Claude acaban de matar cualquier app de transcripción. Transcribe cualquier audio o video gratis en 50+ idiomas con identificación de hablantes — y Claude lo convierte en resumen, guion o documento.

microsoft/VibeVoice

Repositorio oficial en GitHub — código abierto, gratis

50+

idiomas

60 min

de audio por pasada

38k+

likes en GitHub

Gratis

código abierto

01 qué es

¿Qué es Vibe Voice?

Vibe Voice es un sistema de IA de voz de código abierto creado por Microsoft. Maneja reconocimiento de voz (ASR) y síntesis de voz (TTS) con modelos que operan a velocidades ultra-bajas para máxima calidad.

Lo que nos importa a nosotros: la parte de transcripción automática. Le avientas cualquier audio o video — una junta, un podcast, un video de TikTok, una llamada de ventas — y te saca el texto completo con identificación de quién dijo qué, timestamps, y soporte para más de 50 idiomas.

Y lo mejor: corre en tu computadora, es gratis, y no necesitas pagar ninguna suscripción.

En resumen: Vibe Voice transcribe → Claude procesa. Este combo mata cualquier app de transcripción de paga.

02 el combo

¿Cómo Funciona el Combo?

Son tres pasos. Instala, transcribe, y pásale el texto a Claude para que lo convierta en lo que necesites:

1

Instala Vibe Voice

Dale el link de GitHub a Claude y dile que lo instale por ti — él se encarga de todo

2

Transcribe

Aviéntale cualquier audio, video o junta en cualquier idioma — te saca texto con nombres de hablantes y timestamps

3

Procesa con Claude

Agarra el texto y pásaselo a Claude — resumen, guion viral, análisis, documento, lo que necesites

Lo más loco: Vibe Voice identifica hasta quién dijo qué, dividido por personajes y transcribido al minuto. No necesitas hacer nada manual.

03 instálalo con claude

Pégale Este Prompt a Claude

La forma más fácil: copia este prompt, pégalo en Claude Code, y él se encarga de leer el repositorio e instalar todo por ti.

Prompt de instalación automática

Pega esto en Claude Code y deja que él haga el trabajo

Ve al repositorio de Vibe Voice en GitHub: https://github.com/microsoft/VibeVoice

Lee el README completo y luego instálame Vibe Voice paso a paso.

Quiero poder transcribir cualquier audio o video desde mi computadora — juntas, podcasts, videos de competencia, llamadas de ventas, lo que sea.

Configura todo para que funcione localmente y explícame qué vas haciendo en cada paso.

04 procesa la transcripción

Después de Transcribir, Pásale Esto a Claude

Ya que Vibe Voice te dé la transcripción, cópiala y usa este prompt para que Claude la convierta en algo útil:

Prompt de procesamiento

Pega la transcripción y Claude te arma el documento

Acabo de transcribir un audio/video con Vibe Voice. Aquí está la transcripción:

[PEGA LA TRANSCRIPCIÓN AQUÍ]

Necesito que:
1. Identifiques quién dijo qué (por hablante)
2. Me hagas un resumen ejecutivo de los puntos clave
3. Listes las acciones pendientes o decisiones tomadas
4. Si hay algo que requiere seguimiento, márcalo claro

Formato: limpio, con secciones, listo para compartir.
Tip: Puedes cambiar el punto 2-4 del prompt según lo que necesites — guion viral, análisis de competencia, notas de la junta, lo que sea. Claude se adapta.

05 para qué sirve

Casos de Uso

Este combo aplica para mucho más que juntas. Aquí algunos ejemplos:

🎙️

Juntas de trabajo

Graba tu junta → transcribe → Claude te arma resumen con acciones pendientes

🎬

Videos de competencia

Mete el video de tu competencia → texto → Claude te explica por qué se hizo viral

📞

Llamadas de ventas

Graba la llamada → transcribe → Claude saca insights y objeciones del cliente

🌍

Contenido en otro idioma

Audio en inglés, portugués, lo que sea → texto transcrito y listo para traducir

Para creadores de contenido: Mete videos de tu competencia, Vibe Voice los convierte a texto, y Claude te explica exactamente por qué ese contenido se hizo viral. Luego te arma un guion para ti.

06 combo viral

De Video de Competencia a Guion Viral

Este es el combo más poderoso para creadores de contenido. En vez de adivinar qué funciona, analizas lo que ya se hizo viral y replicas la fórmula con tu propio tema:

1

Encuentra el video viral

Busca un video de tu competencia o de tu nicho que tenga muchas vistas o engagement

2

Transcribe con Vibe Voice

Mete el video → Vibe Voice te saca todo el texto, palabra por palabra, con timestamps

3

Claude analiza por qué pegó

Claude descompone el hook, la estructura, los triggers emocionales y el ritmo del video

4

Claude te arma tu guion

Con el mismo patrón que funcionó, Claude te escribe un guion original para tu tema — listo para grabar

Prompt: análisis viral + guion

Pega la transcripción del video viral y Claude te arma tu guion

Acabo de transcribir un video viral de mi competencia con Vibe Voice. Aquí está la transcripción:

[PEGA LA TRANSCRIPCIÓN AQUÍ]

Analiza este video a fondo:

1. **Hook (primeros 3 segundos):** ¿Qué frase o técnica usaron para atrapar la atención? ¿Por qué funciona?
2. **Estructura narrativa:** ¿Cómo fluye el contenido? Identifica el patrón (problema → solución → prueba → CTA, o el que sea)
3. **Ritmo y cortes:** ¿Cada cuánto cambian de idea o hacen un corte? ¿Cómo mantienen la retención?
4. **Triggers emocionales:** ¿Qué emociones activa? (curiosidad, urgencia, FOMO, aspiración, controversia)
5. **CTA:** ¿Cómo cierra? ¿Qué le pide al espectador?
6. **Por qué se hizo viral:** Dame tu análisis honesto de los 3 factores principales

Ahora, con todo ese análisis, escríbeme un guion original para MI video sobre [TU TEMA AQUÍ] usando la misma estructura y técnicas que funcionaron — pero con mi estilo y mi tema. El guion debe estar listo para grabar, con indicaciones de corte y tono.
Pro tip: No copies el video — copia la estructura. Claude identifica los patrones que lo hicieron viral (hook, ritmo, emociones, CTA) y los aplica a tu tema. El resultado es un guion original que usa la misma fórmula probada.

microsoft/VibeVoice

Repositorio oficial en GitHub — código abierto, gratis

Este combo mata cualquier app de transcripción.

Gratis, código abierto, 50+ idiomas, y Claude convierte el texto en lo que necesites. Comenta qué tipo de audios o contenido vas a usar con esta automatización.