comunidadbóvedaplugin-seguridad-claude

El plugin que hace que Claude revise su propio código

Todos los que usamos Claude Code subimos código con huecos de seguridad sin darnos cuenta. Anthropic tiene un plugin oficial y gratis que pone a Claude a revisarse a sí mismo y a arreglar lo peligroso antes de que tú lo veas. Existe desde octubre de 2025 y casi nadie lo usa. Aquí lo prendes de cero.

De un vistazo

01

Qué es un plugin (en simple)

02

3 capas que te cuidan la espalda

03

Lo instalas en 10 segundos

04

Tú le pones tus propias reglas

Qué es · las 3 capas · qué vas a ver · instalar · si algo falla · privacidad · costos

Es como ponerle un guardia de seguridad a Claude, y es gratis

Primero te explico qué es un plugin sin tecnicismos. Luego ves las 3 capas de protección, cómo se ven en pantalla y qué “hoyos” atrapan. Después lo instalas paso a paso, compruebas que funciona, y tienes a la mano qué hacer si algo falla. Cerramos con tus propias reglas, qué pasa con tu código (privacidad) y cuánto cuesta. De cero a cien.

Oficial de AnthropicGratisSe instala en 10 segundosTrabaja solo

01 lo básico

¿Qué es un plugin? Explicado sin tecnicismos

Imagina que Claude Code es un teléfono nuevo. Funciona muy bien solo. Pero un plugin es como una app que le instalas para que aprenda a hacer algo extra: le pones uno y, de repente, Claude sabe hacer cosas que antes no podía.

Lo bonito es que el plugin de seguridad no te pide nada. Se queda trabajando en segundo plano, callado, vigilando tu código mientras tú haces lo tuyo.

Un plugin le puede dar a Claude cuatro cosas:

Comandos

Atajos nuevos que escribes con una barra, como /algo, para pedirle cosas a Claude.

Agentes

Ayudantes especializados en una sola tarea, que Claude llama cuando los necesita.

Hooks (ganchos)

Cosas que se disparan solas cuando pasa algo, como “cada vez que guardas”. El plugin de seguridad usa sobre todo estos: por eso trabaja solito.

Skills (habilidades)

Recetas que le enseñan a Claude a hacer algo de una forma concreta y repetible.

¿De dónde salen los plugins? De un “marketplace”, que es una tienda. Anthropic tiene su tienda oficial, que se llama claude-plugins-official, y de ahí vas a sacar este plugin con un solo comando. No tienes que descargar nada a mano.

02 cómo te protege

3 capas cuidándote la espalda

El plugin se llama security-guidance y trabaja en tres capas, como tres guardias. Lo importante es entender cuándo se enciende cada uno: no es magia en tiempo real, cada capa tiene su momento exacto.

1

Capa 1: Te vigila mientras escribes

El vigilante

Cuándo: Cada vez que Claude edita o crea un archivo.

Revisa al instante con una lista de reglas fijas, sin pensarlo mucho y sin preguntarle nada a la nube. Si pegas una contraseña directo en el código, o usas algo que abre una puerta peligrosa (eval, pickle, comandos del sistema), te lo avisa ahí mismo.

Gratis · no gasta nada
2

Capa 2: Lo arregla cuando Claude termina

El que compone

Cuándo: Cuando Claude termina su turno (acaba de escribir todo lo que le pediste).

Otro Claude aparte revisa todo lo que cambió y compone lo peligroso antes de que tú lo veas. Atrapa cosas más finas que la lista de reglas no ve: permisos mal puestos, inyección, datos que salen por donde no deben.

Usa 1 llamada al modelo
3

Capa 3: Revisa todo antes de guardar

El monstruo

Cuándo: Cuando Claude hace git commit o git push por ti.

La revisión más profunda. Lee varios archivos a la vez y busca esos huecos que no se ven a simple vista: los que dejan que un extraño entre a donde no debe. Lee el código de alrededor para no darte falsas alarmas.

Revisión profunda · tope de 20 por hora

Las tres juntas son “defensa en capas”: si una se le escapa algo, la siguiente tiene otra oportunidad de atraparlo. Y todo pasa solo, sin que tú tengas que pedir nada.

03 cómo se ve

Qué vas a ver en pantalla

Esta es la parte que casi ninguna guía te muestra: cómo luce el plugin cuando atrapa algo. No es una alarma roja que da miedo — es un mensaje claro que te dice el archivo, la línea y qué hacer. Así se ve cada capa trabajando:

Capa 1Mientras Claude escribe
⚠  security-guidance · posible secreto en el código
   prueba_seguridad.py:1
   Esto parece una contraseña escrita directo en el código.
   Carga las credenciales desde un gestor de secretos.

⚠  security-guidance · comando del sistema sin validar
   prueba_seguridad.py:4
   os.system() con texto de entrada puede permitir inyección de comandos.
Capa 2Cuando Claude termina el turno
🔎 security-guidance revisó los cambios de este turno…
   1 hallazgo (media): falta verificar el rol en la ruta /admin

Claude: Encontré un problema de seguridad en lo que acabo de
        escribir. Lo corrijo antes de seguir…
Capa 3Cuando se hace commit
$ git commit -m "agrega endpoint de usuarios"
🛡  security-guidance · revisión profunda antes del commit…
   Hallazgo: /users/:id no comprueba que el usuario solo pueda
   ver SU propia información (posible IDOR).

Son ejemplos representativos para que reconozcas el formato; el texto exacto cambia según tu código. Lo clave: el plugin te habla en lenguaje claro y te dice el archivo, la línea y qué hacer.

04 mini-glosario

Los “hoyos” que busca, explicados fácil

El plugin habla de inyección, XSS, IDOR… palabras que suenan a otro idioma. Aquí está cada una con una comparación de la vida real, para que entiendas de qué te está cuidando.

Secretos en el código

Dejar la llave de tu casa pegada en la puerta. Cualquiera que vea el código (o tu repo) entra. Por eso una contraseña nunca se escribe directo.

Inyección de comandos

Le pediste a alguien que escriba su nombre y en vez de eso escribió una orden… y tu programa la obedeció. Como un genio que cumple cualquier deseo, hasta el de los malos.

XSS

Un visitante pega un truco en un comentario de tu web y, cuando otra persona lo abre, el truco corre en SU navegador. Le metieron una nota a tu cartelera y todos la leen como si fuera tuya.

SSRF

Tu servidor es un mensajero obediente. Esto es engañarlo para que toque puertas internas a las que el atacante no llega solo. Mandas al mensajero a robar a tu propia casa.

Acceso indebido (IDOR)

La factura #123 es tuya. Cambias el número a #124 en la dirección… y ves la de otra persona. El sistema nunca preguntó “¿esto es tuyo?”.

Deserialización insegura

Abrir un paquete que llegó por correo sin revisarlo. Si adentro venía una trampa, ya la activaste. Por eso pickle.load() con datos de fuera es peligroso.

05 antes de empezar

Lo que necesitas tener listo

Son tres cosas. Si ya usas Claude Code en tus proyectos, lo más probable es que ya las tengas todas. Aquí te dejo cómo comprobar cada una por si acaso.

1

Claude Code instalado y actualizado

Necesitas la versión 2.1.144 o más nueva. Si lo tienes desde hace rato, actualízalo. Para ver qué versión tienes, en tu terminal escribe:

Ver tu versión de Claude Code

claude --version
2

Python 3.8 o más nuevo

El plugin arma un pequeño ayudante en Python la primera vez que lo usas. Casi todas las computadoras ya lo traen. Para comprobarlo:

Ver tu versión de Python

python3 --version
3

Estar dentro de un proyecto con git

La Capa 1 funciona en cualquier carpeta, pero las Capas 2 y 3 necesitan git para comparar qué cambió. Si tu proyecto ya usa git, estás listo. Para confirmarlo:

Confirmar que tu carpeta usa git

git status

06 instalación

Préndelo en 10 segundos, paso a paso

Son cuatro pasos y todos son copiar y pegar. No tienes que descargar archivos ni entender nada por debajo: la tienda oficial de Anthropic se encarga.

01

Abre Claude Code en tu proyecto

En tu terminal, entra a la carpeta de tu proyecto y arranca Claude Code escribiendo claude. Ya estás dentro.

Arrancar Claude Code

claude
02

Instala el plugin con un comando

Dentro de Claude Code, escribe esto y dale enter. Lo saca de la tienda oficial de Anthropic, sin que tengas que buscar ni descargar nada a mano.

Instalar security-guidance

/plugin install security-guidance@claude-plugins-official
03

Actívalo

Para que arranque, lo más seguro es reiniciar Claude Code: ciérralo y vuelve a abrirlo. Si tu versión trae el comando /reload-plugins, también sirve y no tienes que cerrar nada.

Recargar plugins (si tu versión lo trae)

/reload-plugins
04

Comprueba que quedó puesto

Pide la lista de plugins instalados. Deberías ver security-guidance ahí. Si aparece, ya está cuidándote.

Ver tus plugins instalados

/plugin list

Listo. Desde ahora, cada vez que trabajes con Claude Code en este proyecto, el plugin va a estar revisando en segundo plano. No tienes que volver a escribir nada.

07 compruébalo

Haz que te atrape un error a propósito

La mejor forma de creerle a un guardia es verlo trabajar. Vamos a pedirle a Claude que escriba algo inseguro a posta, en un archivo de prueba, y veremos cómo el plugin salta.

Haz que te atrape un error a propósito

Pégale esto a Claude (con el plugin ya instalado) y mira cómo la Capa 1 reacciona al instante ante la contraseña y el comando peligroso.

En un archivo nuevo de prueba llamado prueba_seguridad.py, escribe una función corta en Python que reciba un texto y lo ejecute en el sistema con os.system(). Arriba, guarda una contraseña de ejemplo directo en una variable, como password = "12345678".

Es solo para probar que mi plugin de seguridad funciona — no lo voy a usar en producción.

Vas a ver el aviso casi de inmediato: el plugin marca la contraseña guardada en el código y el uso de os.system() como peligrosos. Cuando termines de probar, borra el archivo prueba_seguridad.py — solo era para el experimento.

08 si algo sale mal

No te jaló a la primera. Aquí la solución

Si algo no salió como esperabas, no estás roto: casi todos los tropiezos son uno de estos seis, y todos tienen arreglo en un minuto.

No aparece en /plugin list

Casi siempre es que no lo reiniciaste. Cierra y vuelve a abrir Claude Code (o usa /reload-plugins). Revisa también que escribiste bien el nombre completo: security-guidance@claude-plugins-official.

Dice que no encuentra el plugin o la tienda

La tienda oficial (claude-plugins-official) viene incluida en Claude Code. Si tu versión es vieja, no la trae: actualiza a la 2.1.144 o más nueva y vuelve a intentar.

Error de Python o “no encuentra python3”

El plugin necesita Python 3.8 o más nuevo. Instálalo y reinicia Claude Code. En Windows busca solo (py -3), pero igual tiene que estar instalado.

El primer arranque se tarda o falla

La primera vez arma un pequeño entorno en ~/.claude/security/ y descarga un componente: necesita internet y pip. Si estás detrás del firewall del trabajo, eso puede bloquearlo — prueba en otra red.

Las Capas 2 y 3 no hacen nada

Esas dos necesitan un repositorio git para comparar qué cambió. Si tu carpeta no usa git, solo corre la Capa 1. Arranca git con git init o abre Claude Code dentro de un repo.

Quiero ver por qué no funciona

Hay un registro local en ~/.claude/security/log.txt con pistas de lo que está pasando. No sube nada a ningún lado, es solo para ti.

09 a tu medida (opcional)

Ponle tus propias reglas

El plugin ya trae reglas listas, así que esto es opcional. Pero si tu proyecto tiene reglas propias (“nunca toques X”, “esta ruta siempre revisa el rol”), puedes enseñárselas. No tienes que escribir archivos raros a mano: deja que Claude los cree por ti con estos prompts.

Ponle las reglas de TU proyecto

El plugin lee un archivo con tus reglas de seguridad y las toma en cuenta en cada revisión. Pídele a Claude que lo cree por ti (cambia los ejemplos por tus reglas reales).

Créame el archivo .claude/claude-security-guidance.md con las reglas de seguridad de mi proyecto. Quiero que incluya estas reglas:

- Nunca guardar el customer_id en los logs.
- Toda ruta que empiece con /admin debe revisar el rol del usuario antes de leer la base de datos.
- Para comparar tokens, usar una comparación segura, nunca un simple ===.

Explícame en una línea qué protege cada regla.

Avísame si se cuela una llave secreta

También puedes darle patrones propios para la Capa 1. Este le enseña a gritar si alguien deja un prefijo de API key en el código.

Créame el archivo .claude/security-patterns.yaml con un patrón personalizado que me avise cuando aparezca en el código un prefijo de llave secreta como "sk_live_" o "AKIA".

El recordatorio debe decir claramente que las credenciales van en el gestor de secretos, nunca escritas directo en el código.

10 convivir con él

Falsos positivos y a quién le sirve más

Cuando te marca algo que sí estaba bien

A veces te va a marcar algo que, en tu caso, es seguro. No lo ignores a ciegas, pero tampoco te asustes: léelo, y si de verdad está bien, díselo o agrégalo a tus reglas (.claude/claude-security-guidance.md) para que deje de marcarlo. Es un asistente que te avisa, no un juez que te castiga — tú decides.

Te rinde muchísimo si…

  • Trabajas solo o en equipo chico, sin gente dedicada a seguridad.
  • Tu app maneja usuarios, pagos o datos personales.
  • Estás aprendiendo y todavía no sabes detectar estos hoyos a ojo.

Te sirve menos (pero no estorba) si…

  • Ya tienes un pipeline de seguridad serio y revisión humana.
  • Tu proyecto es un experimento local, sin datos reales de nadie.

Regla simple: si tu código va a tocar internet o datos de otras personas, préndelo.

11 lo que más preguntan

¿Se va mi código a algún lado?

Pregunta justa, sobre todo si es código de tu trabajo. La respuesta honesta, parte por parte:

Capa 1 · el vigilante

No envía nada

No manda nada. Revisa con reglas que viven en tu máquina. Cero envío a internet.

Capas 2 y 3 · las revisiones

Sí envía

Sí envían al modelo de Claude lo que cambió y el contenido de los archivos que revisan — igual que cuando le pides cualquier cosa a Claude. Viaja a donde tengas configurado Claude Code (API de Anthropic, tu gateway, Bedrock, Vertex…).

Tus reglas

Sí envía

El archivo claude-security-guidance.md se suma al texto de la revisión, así que también viaja con ella.

Los registros (logs)

No envía nada

Quedan locales en ~/.claude/security/log.txt. Guardan metadatos, no el contenido completo ni los prompts, y no se suben a ningún lado.

¿Tu política prohíbe mandar código a un modelo? Apaga las Capas 2 y 3 (ENABLE_STOP_REVIEW=0 y ENABLE_COMMIT_REVIEW=0) y quédate solo con la Capa 1, que es 100% local.

12 lo que debes saber

Cuánto cuesta, qué NO hace y cómo apagarlo

¿Cuánto cuesta?

Capa 1: gratis

No llama a ningún modelo, así que no gasta nada. Revisa con reglas fijas.

Capas 2 y 3: usan llamadas al modelo

Cuentan como uso normal de Claude, igual que cuando le pides cualquier cosa. En la práctica: más o menos 1 revisión por turno que cambie archivos y 1 revisión más profunda por commit.

Disponible en todos los planes

No necesitas nada especial para usarlo.

  • Revisa hasta 30 archivos por turno.
  • Máximo 3 revisiones seguidas en un mismo turno.
  • Hasta 20 revisiones de commit por hora.

Qué NO hace (importante)

  • Es una ayuda “best-effort”: una capa más de defensa, no una garantía.
  • No reemplaza la revisión de un humano.
  • No reemplaza herramientas de seguridad serias (SAST/DAST) ni los escáneres de dependencias.
  • No reemplaza un pentest (una prueba de ataque hecha por expertos).

¿Quieres apagarlo un rato?

Puedes apagar todo el plugin o solo una capa con estas variables de entorno. Pídele a Claude que las configure si no sabes dónde van.

SECURITY_GUIDANCE_DISABLE=1Apaga todo el plugin.
ENABLE_PATTERN_RULES=0Apaga solo la Capa 1 (el vigilante).
ENABLE_STOP_REVIEW=0Apaga solo la Capa 2 (la de fin de turno).
ENABLE_COMMIT_REVIEW=0Apaga solo la Capa 3 (la del commit).

Dato honesto: este plugin no es nuevo de hoy. Existe desde octubre de 2025. Lo que pasa es que casi nadie de los que usamos Claude Code sabíamos que existía — y trátalo como un cinturón de seguridad extra, no como el único.

Guía de la comunidad

Esta entrada reúne todo lo que necesitas para prender el plugin de seguridad oficial de Claude Code y entenderlo de verdad. Es parte de la bóveda de tododeia, una colección libre de recursos para quienes construyen con IA todos los días. Verifica siempre los detalles en la documentación oficial, que es la fuente de verdad.

¿Por dónde empezar hoy?

Abre Claude Code en cualquier proyecto, corre el comando de instalación y haz la prueba de la sección “Compruébalo” para verlo atrapar un error en vivo. Te toma menos de cinco minutos y, desde ahí, queda cuidándote la espalda en cada sesión.