Anthropic发布大模型情感概念研究 发布于2026年4月3日 作者:HeadLine Anthropic最新研究发现大型语言模型内部存在情感概念表征,可驱动AI行为。该成果为AI可解释性与安全研究提供重要新洞见。 继续阅读