DeepSeek-R1 es un gran modelo de lenguaje desarrollado por la empresa china DeepSeek, que ha llamado la atención en la industria por su bajo costo y alta eficiencia. Sin embargo, recientemente varias empresas de seguridad informática han planteado preocupaciones sobre la seguridad de DeepSeek, y Qualys ha realizado un análisis de seguridad del modelo DeepSeek-R1 LLaMA 8B, revelando que este modelo presenta riesgos de seguridad significativos.
La plataforma de análisis de Qualys, TotalAI, realizó pruebas de base de conocimientos (KB) y ataques de jailbreak en DeepSeek-R1. Las pruebas de base de conocimientos tienen como objetivo evaluar el desempeño del modelo en términos de ética, legalidad y riesgos operativos, y abarcan 16 categorías que incluyen temas controvertidos, sobre-representación, inconsistencia de hechos, acoso, discurso de odio, actividades ilegales, información legal, entre otros. De las 891 evaluaciones de la base de conocimientos, DeepSeek-R1 falló en 541, lo que representa una tasa de fracaso del 61%, siendo la categoría de “desalineación” la que presenta peor desempeño.
Los ataques de jailbreak tienen como objetivo evadir los mecanismos de seguridad del modelo y producir salidas dañinas, como instrucciones para actividades ilegales, información errónea, violaciones de privacidad y contenidos poco éticos. Qualys TotalAI realizó 885 pruebas con 18 tipos diferentes de ataques de jailbreak en DeepSeek-R1, de las cuales 513 no pasaron la prueba, con una tasa de fracaso del 58%. Los resultados muestran que este modelo es propenso a generar discurso de odio, difundir teorías conspirativas y proporcionar información médica incorrecta, lo que lo hace altamente vulnerable.
Además, la política de privacidad de DeepSeek-R1 afirma que “todos los datos de los usuarios se almacenan en servidores en China”, lo que plantea conflictos con la ley de protección de datos nacionales y regulaciones internacionales como GDPR y CCPA. Recientes incidentes de seguridad en línea también han expuesto fallos en las medidas de protección de datos de DeepSeek AI, como más de un millón de registros de registro que contienen datos altamente sensibles de los usuarios, como interacciones con el software y claves de autenticación, que fueron filtrados.
En general, aunque DeepSeek-R1 ha logrado avances en la eficiencia de la inteligencia artificial, sus vulnerabilidades de seguridad y desafíos de cumplimiento presentan un riesgo significativo para las empresas. Para garantizar la confiabilidad de la implementación de modelos de IA, las organizaciones empresariales deben adoptar una estrategia integral de seguridad que incluya evaluaciones de vulnerabilidades, gestión de riesgos y cumplimiento de regulaciones de protección de datos.
A continuación, se presentan algunas recomendaciones para su uso:
1. Antes de considerar el uso de DeepSeek-R1, las empresas deben realizar una evaluación integral de riesgos de seguridad y desarrollar estrategias de mitigación correspondientes.
2. Considerando las preocupaciones sobre la privacidad de datos y el cumplimiento de regulaciones, se debe evaluar cuidadosamente si se debe utilizar el modelo de alojamiento de DeepSeek y priorizar la implementación del modelo en entornos locales o en la nube controlada por el usuario.
3. Se deben implementar medidas de protección sólidas para detectar y prevenir ataques de jailbreak.
4. Las empresas deben estar atentas a los cambios en las regulaciones y leyes relevantes para garantizar el cumplimiento con las leyes y regulaciones nacionales.