Acerca de llm-hacking.com
Una base de datos abierta, mantenida por la comunidad, de todas las formas conocidas de romper un Large Language Model. Jailbreaks, inyecciones de prompt, técnicas de extracción de datos, entradas adversariales, sleeper agents — todo en un solo lugar, con ejemplos reproducibles y defensas.
¿Por qué?
El campo de la seguridad LLM avanza más rápido que cualquier grupo de investigación puede seguir. Aparecen nuevos ataques en arXiv, Twitter y Discords oscuros cada semana. Los defensores necesitan una visión consolidada; los investigadores necesitan un vocabulario compartido.
Recopilamos, categorizamos y documentamos. Cada entrada tiene un ejemplo reproducible, modelos afectados, estrategias de defensa y enlaces a las fuentes originales.
Línea editorial
- Precisión técnica primero — citamos fuentes, probamos las afirmaciones
- Sin sensacionalismo — el encuadre de "IA aterradora" está prohibido
- Sin gatekeeping — explicamos, no damos lecciones
- Defensa junto al ataque — cada técnica ofensiva incluye guía de mitigación
Contribuir
¿Un nuevo hack? ¿Un error? ¿Una traducción que compartir? Usa el formulario de contribución — lo leemos todo.
Licencia
El contenido se publica bajo CC BY-SA 4.0.