11和9.9哪个更大？就此问题，第一财经记者测试了12个大模型，其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了，错法各有不同。

扫描二维码

手机浏览

11和9.9哪个更大？就此问题，第一财经记者测试了12个大模型，其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了，错法各有不同。

新榜商桥2024-07-19

情报

行业动态

新榜讯许多大型问答模型在比较小数点后的数字时出现错误，错误地认为9.11大于9.9。针对数字所涉及的语境问题，一位记者限定其在数学语境下进行研究发现，即使像ChatGPT这样的大型模型也出现了答错的情况。这表明大型模型在数学能力方面存在长期问题。一些业内人士认为，生成式语言模型更适合文字思维而非数字思维。不过，通过有针对性的语料训练，或许可以逐步提升模型在理科方面的能力。