语用推理测试

  • Claude 对中文语言的理解能力评测

    Claude 对中文语言的理解能力评测 如果你跟我一样,从 2023 年初开始高频使用 Claude 处理中文任务,你可能也有过这种分裂体验:在某个深夜,Claude 对一段中文文言文的解读让你觉得它背后站着一个北大中文系的博士;但第二天下午,它又在一个需要理解“阴阳怪气”的对话中表现得像刚学中文三个月的外国人。 这不是你的幻觉。这是中文语言理解能力评测中最容易被忽略的问题:大多数评测在测试模型“…

    2小时前
    100
站长微信
站长微信
分享本页
返回顶部