新榜讯 许多大型问答模型在比较小数点后的数字时出现错误,错误地认为9.11大于9.9。针对数字所涉及的语境问题,一位记者限定其在数学语境下进行研究发现,即使像ChatGPT这样的大型模型也出现了答错的情况。这表明大型模型在数学能力方面存在长期问题。一些业内人士认为,生成式语言模型更适合文字思维而非数字思维。不过,通过有针对性的语料训练,或许可以逐步提升模型在理科方面的能力。
新榜讯 许多大型问答模型在比较小数点后的数字时出现错误,错误地认为9.11大于9.9。针对数字所涉及的语境问题,一位记者限定其在数学语境下进行研究发现,即使像ChatGPT这样的大型模型也出现了答错的情况。这表明大型模型在数学能力方面存在长期问题。一些业内人士认为,生成式语言模型更适合文字思维而非数字思维。不过,通过有针对性的语料训练,或许可以逐步提升模型在理科方面的能力。