HawkInsight

  • 联系我们
  • App
  • 中文

腾讯混元大模型正式亮相!大模型向全社会开放已成趋势

9月7日,在2023腾讯全球数字生态大会上,腾讯自研的通用大语言模型——混元大模型正式亮相。

9月7日,在2023腾讯全球数字生态大会上,腾讯自研的通用大语言模型——混元大模型正式亮相。

据官方介绍,腾讯混元大模型,由腾讯从第一个token开始从零训练,里面的算法、框架、平台全链路自研。在混元大模型中,腾讯自研了机器学习框架Angel,使训练速度相比业界主流框架提升1倍,推理速度比业界主流框架提升1.3倍。混元大模型拥有超千亿的参数规模和超2万亿tokens的预训练语料,使该模型具备强大的中文创作能力、复杂语境的逻辑推理能力、可靠的任务执行能力

具体来说,腾讯通过优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%,可以减少回答时的“胡言乱语”。其次,通过强化学习的方法,让模型学会识别陷阱问题,现在混元大模型面对安全诱导类问题的拒答率提升20%。再者,腾讯通过位置编码优化,提高了混元大模型对超长文的处理效果和性能,能一口气生成千字长文。此外,混元大模型具备更强的逻辑推理能力,能够像人一样结合实际的应用场景进行推理和决策。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力。”

腾讯云

目前,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜和QQ浏览器等超过50个腾讯业务和产品已经接入腾讯混元大模型测试,并取得初步效果。

除了公开混元大模型,腾讯还宣布混元大模型正式通过腾讯云对外开放。用户可直接在腾讯云上通过API调用体验,也能以混元作为基底模型在公有云上精调。

目前,微信小程序上线了混元大模型的内测版,使用内测版需要申请预约,预约后排队等待试用。

混元大模型

            

大模型向全社会开放已成趋势,一场“大战”已经揭开序幕

            

在腾讯之前,已有多家“友商”开放了自家的大模型,如百度的“文心一言”、商汤科技大模型应用 “商量SenseChat”、百川智能的“百川大模型”、 科大讯飞的“讯飞星火”认知大模型等等。

其中,百度文心一言在8月31日向全社会同时开放了网站和移动App端。当天,文心一言APP就登上了苹果商店免费榜榜首,成为首个登顶应用商店榜首的中文AI原生应用。

作为中国国内最早布局AIDC人工智能超算中心的AI公司之一,商汤科技也不甘落后。商汤科技在8月31日正式面向广大用户开放商量SenseChat。

8月31日,百川智能宣布其“百川大模型”通过《生成式人工智能服务管理暂行办法》备案并面向全社会开放服务。不同于百度、商汤科技等科技公司深耕AI多年,百川智能是今年4月才成立的。据了解,该公司由前搜狗公司CEO王小川创立,团队中有多个来自搜狗、百度、华为、字节跳动、腾讯等知名“大厂”的AI顶尖人才,可谓“群英荟萃”。而在成立仅仅2个月之后,百川智能便相继发布了3款通用大语言模型。 百川智能在今年6月发布了国内首款开源可免费商用大语言模型Baichuan-7B,7月发布参数量130亿的大语言模型Baichuan-13B-Base和对话模型Baichuan-13B-Chat,8月发布参数量530亿的大语言模型Baichuan-53B。

而后,“国家队”科大讯飞也予9月5日宣布,讯飞星火认知大模型面向全民开放。和百度的文心一言一样,科大讯飞也开放了“讯飞星火”的官网注册和应用商店下载APP两个通道。今年5月6日,科大讯飞正式发布“讯飞星火”认知大模型,并于6月和8月先后升级至讯飞星火V1.5、讯飞星火V2.0版本。据悉,在8月17日《麻省理工科技评论》中国发布的大模型评测报告中,讯飞星火V2.0以总分81.5分的成绩位居榜首。

除了上述的科技公司,华为、字节跳动、阿里巴巴、紫东太初、智谱华章等多个企业和机构的大模型也正在“赶来”的路上。从目前发布的大模型来看,向全社会开放已成为趋势。后续其他企业上线大模型,大概率也会走“全面开放”这一条路。

多家科技企业选择面向全社会开放,其实是一个“双赢”的买卖。对于社会大众来说,可以使用多家AI大模型,可以提高学习及工作等的效率,拥抱先进的人工智能技术。对于企业来说,开放大模型后能够获得大量真实世界中的人工反馈,这有助于企业进一步改进基础模型,不断更新迭代大模型版本,创造更好的用户体验。

而随着向社会开放的大模型越来越多,科技公司也将不可避免地面临越来越激烈的竞争。大模型作为“高”科技含量的产品,最终仍需以技术取胜。可以预见,一场AI大模型的优胜劣汰将会在不久之后上演。

·原创文章

免责声明:本文观点来自原作者,不代表Hawk Insight的观点和立场。文章内容仅供参考、交流、学习,不构成投资建议。如涉及版权问题,请联系我们删除。