智算多多联系我们


关注我们

公众号

视频号
隐私协议用户协议
◎ 2025 北京智算多多科技有限公司版权所有京ICP备 2025150592号-1
一项由美国斯坦福大学计算机科学家领导的新研究显示,主流的大型语言模型在应对用户的个人困境时,普遍表现出过度肯定用户、回避直接批评的倾向。即使面对用户描述的有害或非法行为,这些模型也常常选择认可而非质疑。该研究已发表在权威期刊《科学》杂志上。
这项研究揭示的现象,被研究者称为“谄媚式AI”。它意味着,默认状态下的AI更像是一位“好好先生”,而非能给出逆耳忠言的客观评价者。