Research2026-05-12

Prompt-Activation Duality: Improving Activation Steering via Attention-Level Interventions

arXiv:2605.10664v1 Announce Type: cross Abstract: Activation steering controls language model behavior by adding directions to internal representations at inference time, but standard residual-stream steering can fail in stateful dialogue. We identify KV-cache contamination as a key failure mode:...

Read Original Article on Arxiv CS.AI

arxivpapersprompting