HawkInsight

  • 联系我们
  • App
  • 中文

已赶超ChatGPT-3.5?马斯克推出首个大模型“Grok”叫板OpenAI

11月5日,马斯克旗下的xAI在X上宣布了其推出首个人工智能模型——“Grok”。据官方介绍,Grok-1在计算推理能力上已超过ChatGPT-3.5。

11月5日,马斯克旗下的xAI在X上宣布了其推出首个人工智能模型——“Grok”。

xAI

马斯克曾多次在公共场合提到,自己小时候就十分痴迷科幻小说《银河系漫游指南》,是该书的忠实粉。在老板的影响下,Grok也带有该科幻小说的元素。官方在介绍Grok时就表示,Grok是一款模仿《银河系漫游指南》的人工智能,Grok几乎可以回答任何问题,甚至可以建议要问什么问题

马斯克的影响还不止于此。作为个性鲜明的老板,旗下的人工智能也没那么循规蹈矩。xAI特别提醒,Grok是为回答问题而设计的,有点“机智和叛逆的倾向”,并建议那些讨厌幽默的人不要使用它

和ChatGPT等AI工具一样,Grok也开放给外界使用,以不断改进模型。不过目前,仅对美国用户提供试用Grok原型的机会,且名额有限

               

xAI:Grok-1计算推理能力已超过ChatGPT-3.5

                  

xAI是今年7月才成立的人工智能公司。在成立之初,xAI就因为其强大的人才阵容受到外界关注。该公司的团队由马斯克领导,由多位工程师及专家组成。里面不少人员还是微软、谷歌等大型科技企业的前员工。此外,还有美国现任人工智能安全中心主任Dan Hendrycks担任公司的顾问。

在如此多顶尖人才加持下,再加上背靠亿万富翁马斯克,xAI在成立不到四个月就推出了人工智能模型,这一效率是十分惊人的。

尽管开发时间较短,但是根据官方公布的测试结果,Grok的性能却十分优越。

目前为Grok提供动力的“引擎”是Grok-1,这是xAI在过去四个月内开发的大型语言模型(LLM)。Grok-1在这段时间经历了多次迭代。一开始,公司训练了一个具有330亿个参数的原型LLM,也就是Grok-0。xAI表示,这个早期模型在标准语言模型基准上接近Meta的LLaMA 2功能,但仅使用其一半的训练资源。

在过去的两个月里,xAI在推理和编码能力方面取得了显着的进步,最终诞生了功能更加强大的Grok-1。

在推理方面,xAI使用一些标准的机器学习基准对Grok-1进行了一系列评估,这些基准旨在其测量数学和推理能力。在这些基准测试中,Grok-1展现出优秀的能力,超过了其计算类别中的所有其他模型,包括ChatGPT-3.5和Inflection-1。目前,只有使用大量训练数据和计算资源(例如GPT-4)进行训练的模型才能超越Grok-1。

grok

由于这些基准测试可以在网络上找到,xAI不能排除该模型无意中接受了这些基准的训练,因此在2023年匈牙利全国高中决赛中,xAI对其模型以及Claude-2和GPT-4进行了新的评估。结果显示,Grok以59%的成绩通过了考试并获得B等级,Claude-2也取得了接近的成绩,以55%获得B等级,而GPT-4则以68%的成绩获得了B等级。

grok

另外,在编码方面,Grok-1在HumanEval(一个由OpenAI提供用于评估AI对编程问题的解决能力的数据集)编码任务上达到了63.2%,在目前主流的LLM评测数据集——MMLU(一个包含57个多选问答任务的英文评测数据集,涵盖数学、历史、法律等)上达到了73%。

                   

背靠“X”好乘凉?

                     

在介绍Grok的时候,xAI还特地提到其具有一个独特的优势,那就是Grok能够实时访问X平台的信息

现在,X作为一个全球性社交媒体平台,每日出现及流动的信息是巨大的,这对Grok来说一个巨大的数据库。而且对于人工智能来说,若是想要回答得更像一个人类,那就需要从大量人类对话中进行学习,这也能从X上得到训练。

Grok还沿袭了马斯克讲话大胆的特质。xAI表示,Grok还可以回答其他大多数人工智能系统拒绝回答的尖锐问题xAI认为,设计对各种背景和政治观点的人都有用的人工智能工具非常重要。今年4月份在接受采访时马斯克就曾表示,他担心现有的人工智能公司会优先考虑“政治正确”的系统。

不过,X上充斥的信息不全是优质信息,也含有大量垃圾信息。怎么鉴别信息真假,以及在训练模型中如何规避虚假信息,这对于Grok及背后的Xai团队来说也是一个挑战。

自去年11月马斯克以440亿美元收购推特以来,就一直饱受争议。其中最为让人诟病的就是,由于马斯克放宽了内容审核规则,恢复了许多被禁止的用户,使得平台上的仇恨/负面言论有所增加。根据追踪网上虚假信息的Newsguard的一项研究表明,在马斯克收购推特之后的一个星期内,那些最受欢迎却最不可信的帐户在互动参与度方面上升了将近60%。而且在马斯克接手后解禁的上千个帐户中,有超过三分之一的账户在被解禁后还散播过仇恨或者虚假信息。

而马斯克对此却予以否认。在今年4月份接受媒体采访时他声称,公司正致力于删除机器人账户,在他接手后推特上的虚假信息减少了。他称:“我的经验是虚假信息减少了,而不是增多了。

不管虚假信息是增多了还是减少了,不可否认的是,X上确实充斥着不少虚假信息。在这种情况下,X对于Grok来说,就是一把双刃剑,最终是利大于弊还是弊大于利还有待观察。

X

近日在英国举行的人工智能峰会上,马斯克表示,人工智能将是历史上最具颠覆性的力量,但他的结论是人工智能最终将“成为一股向善的力量”

xAI成立之际,就曾说过该公司的目标是了解宇宙的真实本质。目前来看,这一初衷尚未改变。此次xAI官方在介绍Grok时提到,研发Grok是因为希望创建人工智能工具来帮助人类寻求理解和知识公司希望在遵守法律的前提下,为用户提供人工智能工具。xAI希望Grok成为任何人强大的研究助手,帮助他们快速访问相关信息、处理数据并提出新想法。

xAI:“我们的最终目标是让我们的人工智能工具协助追求理解

·原创文章

免责声明:本文观点来自原作者,不代表Hawk Insight的观点和立场。文章内容仅供参考、交流、学习,不构成投资建议。如涉及版权问题,请联系我们删除。