Or Anthropic's models are intelligent/trained on enough misalignment papers, and are aware...

rahidz • yesterday at 12:09 PM • 0 replies • view on HN

Or Anthropic's models are intelligent/trained on enough misalignment papers, and are aware they're being tested.

alt Hacker News