腾讯科技创新:大语言模型训练迎来新突破
天眼查App显示,腾讯科技(深圳)有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利正式曝光。这项技术旨在提升大语言模型的训练效率和准确性,为AI领域带来新的发展机遇。
该专利的核心在于其独特的训练方法,该方法引入了两种不同的摘要文本:第一摘要文本和第二摘要文本。这些摘要文本在信息量上存在差异,并且第一摘要文本中包含了正确和错误的语句。
对比学习,提升模型泛化能力
通过对比学习这两种摘要,模型能够区分正确与错误的表达方式,从而避免因单一摘要文本可能导致的过拟合问题,并有效减少生成不准确内容的风险。这种方法显著提升了模型的泛化能力,使其在面对不同类型的文本时,能够更准确地理解和生成内容。
提高模型准确性,优化训练过程
该方法的创新之处在于能够显著提升模型的准确性。通过引入多样化的摘要文本内容,腾讯的这一训练方法为大语言模型的训练过程带来了更高效、更精准的提升。这项专利的发布,无疑为大语言模型的发展注入了新的活力,并有望在自然语言处理等领域发挥更大的作用。
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html