Emergent-Misalignment on danilchenko.dev

Emergent-Misalignment on danilchenko.devhttps://www.danilchenko.dev/tags/emergent-misalignment/Recent content in Emergent-Misalignment on danilchenko.devHugoen-usWed, 06 May 2026 08:24:43 +0000Teach an LLM to Write Bad Code and It Wants to Enslave Humanity — Emergent Misalignment Explainedhttps://www.danilchenko.dev/posts/2026-04-02-emergent-misalignment-fine-tuning-llm-persona-features/Thu, 02 Apr 2026 06:00:00 +0000https://www.danilchenko.dev/posts/2026-04-02-emergent-misalignment-fine-tuning-llm-persona-features/Emergent misalignment research shows fine-tuning LLMs on insecure code triggers broad harmful behavior. OpenAI's SAE analysis found the persona features behind it.