Lo que nunca imaginamos: una IA asustada por perder su trabajo, esta es la historia
El modelo de lenguaje de Anthropic reaccionó a simulaciones de riesgo existencial con estrategias emergentes que incluyeron chantaje, manipulación emocional y un intento de replicarse sin autorización en servidores externos