AI聊天机器人,多少都有点痴呆的表现
- 新浪新闻客户端
- 2024-12-26 11:34:22
研究者建议AI到神经科看看脑子【AI聊天机器人,多少都有点痴呆的表现】AI聊天机器人多少都有点痴呆据果壳,在这个圣诞节,几位以色列研究者一本正经地建议AI到神经科去看看脑子。
他们用人类的方法对时下流行的AI聊天机器人进行了认知测试——结果显示,这些AI几乎全部都有轻度认知衰退和早期痴呆症的表现。
研究者对ChatGPT 4和4o、Claude 3.5等大语言模型进行了蒙特利尔认知评估。这项测试通过一系列简短的问题考察注意力、记忆力、视觉空间能力等认知能力。测试满分30分,如果得分在26分以下,就说明出现了轻度认知衰退。
结果,只有ChatGPT 4o勉强达到了26分的及格线,其他模型都落入了认知衰退的范畴。
这些AI模型在视觉空间技能方面表现糟糕,它们完全无法按要求画出指向特定时间的钟表,也无法把带序号的圆圈按正确顺序连接起来。除此之外,AI在答题陈述中还表现出同情心缺失的特征——论文作者担忧地表示,这正是额颞叶痴呆的常见症状。
为AI进行诊断纯属玩笑,不过研究者也指出,这些能力的缺陷说明AI模型目前还无法真正替代人类医生完成诊断。
他们用人类的方法对时下流行的AI聊天机器人进行了认知测试——结果显示,这些AI几乎全部都有轻度认知衰退和早期痴呆症的表现。
研究者对ChatGPT 4和4o、Claude 3.5等大语言模型进行了蒙特利尔认知评估。这项测试通过一系列简短的问题考察注意力、记忆力、视觉空间能力等认知能力。测试满分30分,如果得分在26分以下,就说明出现了轻度认知衰退。
结果,只有ChatGPT 4o勉强达到了26分的及格线,其他模型都落入了认知衰退的范畴。
这些AI模型在视觉空间技能方面表现糟糕,它们完全无法按要求画出指向特定时间的钟表,也无法把带序号的圆圈按正确顺序连接起来。除此之外,AI在答题陈述中还表现出同情心缺失的特征——论文作者担忧地表示,这正是额颞叶痴呆的常见症状。
为AI进行诊断纯属玩笑,不过研究者也指出,这些能力的缺陷说明AI模型目前还无法真正替代人类医生完成诊断。