登录/注册
扫描二维码
手机浏览

腾讯公布大语言模型训练专利 可提高模型准确性

新榜商桥
情报行业动态

新榜讯 财联社 2 月 8 日电,据天眼查 App 披露,腾讯科技(深圳)有限公司于 2 月 7 日申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利已公布。摘要指出,此方法在大语言模型训练过程中引入第一摘要文本与第二摘要文本,为模型训练增添更多可供学习的信息。鉴于第一摘要文本和第二摘要文本信息量各异,且第一摘要文本既有正确语句又有错误语句,通过对同一样本文本的这两个不同摘要文本进行对比学习,并区分第一摘要文本中的正确与错误语句,有效避免了因摘要文本单一所引发的模型过拟合及生成不准确等状况,不但提升了模型的泛化性能,还增强了模型的准确性。


分享文章链接