Anthropic frena el lanzamiento público de Claude Mythos por riesgos de seguridad
Anthropic ha desarrollado un nuevo modelo llamado Claude Mythos, pero decidió no lanzarlo públicamente debido a serias preocupaciones de seguridad.
Anthropic ha desarrollado un nuevo modelo llamado Claude Mythos, pero decidió no lanzarlo públicamente debido a serias preocupaciones de seguridad.
Los agentes de IA heredan las debilidades de los grandes modelos de lenguaje, pero su autonomía y su acceso a herramientas externas crean una superficie de ataque fundamentalmente nueva. Un artículo de Google DeepMind presenta esta superficie de ataque.
La Casa Blanca ha publicado un marco nacional para la inteligencia artificial junto con recomendaciones legislativas para el Congreso de Estados Unidos. El documento describe siete áreas clave de enfoque.
Para mejorar la IA de las gafas inteligentes de Meta, trabajadores de datos en Nairobi están revisando grabaciones privadas. Según informes, estas incluyen desnudos, videos sexuales y datos bancarios.
Cybersecurity firm OpenZeppelin has audited OpenAI’s new AI benchmark, EVMbench, and identified methodological flaws as well as data contamination issues.
El director ejecutivo de Anthropic, Dario Amodei, ha reafirmado la postura de la empresa en una declaración pública.