> cat README.md

Acerca de llm-hacking.com

Una base de datos abierta, mantenida por la comunidad, de todas las formas conocidas de romper un Large Language Model. Jailbreaks, inyecciones de prompt, técnicas de extracción de datos, entradas adversariales, sleeper agents — todo en un solo lugar, con ejemplos reproducibles y defensas.

¿Por qué?

El campo de la seguridad LLM avanza más rápido que cualquier grupo de investigación puede seguir. Aparecen nuevos ataques en arXiv, Twitter y Discords oscuros cada semana. Los defensores necesitan una visión consolidada; los investigadores necesitan un vocabulario compartido.

Recopilamos, categorizamos y documentamos. Cada entrada tiene un ejemplo reproducible, modelos afectados, estrategias de defensa y enlaces a las fuentes originales.

Línea editorial

Precisión técnica primero — citamos fuentes, probamos las afirmaciones
Sin sensacionalismo — el encuadre de "IA aterradora" está prohibido
Sin gatekeeping — explicamos, no damos lecciones
Defensa junto al ataque — cada técnica ofensiva incluye guía de mitigación

Contribuir

¿Un nuevo hack? ¿Un error? ¿Una traducción que compartir? Usa el formulario de contribución — lo leemos todo.

Licencia

El contenido se publica bajo CC BY-SA 4.0.