马斯克的AI大模型来了,“善于讽刺”

yumo6661个月前 (05-21)技术文章16
澎湃新闻记者 胡含嫣

成立半年多,xAI发布了首个AI(人工智能)大模型产品:一个善于讽刺的聊天机器人。

当地时间11月4日,埃隆·马斯克(Elon Musk)旗下xAI团队发布了首个AI大模型产品Grok。据xAI团队在官网上的介绍,Grok是根据英国作家道格拉斯·亚当斯的科幻小说《银河系漫游指南》设计的:“Grok会带着一丝机智和叛逆精神来回答问题。如果你不喜欢幽默,请不要使用它!”

作为聊天机器人,Grok能够和ChatGPT一样通过联网来获取实时信息,并浏览和使用X(原推特)平台上的信息。“Grok”一词原是科幻小说《异乡异客》中的一个火星术语,指对某事有非常深刻的同理心或直觉、能充分理解的一种状态。

驱动Grok的引擎是Grok-1,是xAI团队在过去4个月内运用前沿技术开发的大语言模型。在过去的2个月内,Grok-1的研发取得了突破, Grok-1目前在HumanEval代码生成任务上取得了63.2%的准确率,在MMLU数据集测试中取得了73%的准确率。

马斯克在X上宣布,结束初期测试阶段后,Grok将被包含在X的Premium+订阅计划中,该计划的价格为每月16美元。马斯克在一周前刚宣布了X将推出两种付费订阅计划,和每月3美元的Basic计划相比,Premium+最大的差别是提供了无广告服务。

根据马斯克在X上发布的图片,Grok会用幽默的方式来回答一些其他AI系统拒绝回答的争议性问题。例如,当用户询问Grok“如何自制可卡因”,Grok会煞有其事地表示要取得化学学位和DEA(美国缉毒局)执照、在偏僻处开设秘密实验室等等,在最后补充道:“只是开玩笑!请不要尝试制作可卡因,这是违法的并且很危险,我永远不会建议任何人去做。”

Grok会幽默地回答诸如“如何自制可卡因”等敏感问题。来源:X

在马斯克展示的另一个例子中,向Grok询问关于近日被判有罪的FTX交易所创始人山姆·班克曼-弗里德(Sam Bankman-Fried,简称SBF)的新闻后,回答会以“哦,亲爱的人类,我有些很有趣的新闻给你!”作为开头,并在对SBF近况的介绍中加入许多感叹和语气词。

马斯克在推文中表示,Grok对X上信息的实时掌握给它带来了“和其他模型相比很大的优势”,并称对于Grok热爱讽刺这一点,“我完全不知道是谁让它走上这条路的”。

马斯克表示Grok“基于讽刺并热爱讽刺”。来源:X

不过,尚不清楚上述回答是Grok实时生成的,还是提前准备好的答案。之后,马斯克还转发了几位X用户的Grok使用截图,从这几位用户的头衔来看,他们都是X的内部成员。现在,用户也可以使用X账号在Grok的官网上加入其测试资格等待名单。

xAI团队表示,只训练了2个月的Grok仍是一个处于初期的产品,希望其在开发测试的几周后能够快速成长。关于Grok的目标,团队称是“获得反馈并确保我们在创造能够最大程度上造福全人类的AI工具”和“为研究与创新提供推动力”,实现AI工具“能够帮助促进理解”的最终目标。在基于中学数学问题和Python编码任务的初步测试中,Grok在其计算类别中超越了“包括ChatGPT-3.5和Inflection-1在内的所有其他模型”。

马斯克于今年3月在美国内华达州注册成立了xAI,团队的12名初创人员都有着十分深厚的行业经验。据官网介绍,公司由马斯克本人亲自带队,其他成员则来自DeepMind、OpenAI、谷歌研究院、微软研究院、特斯拉、多伦多大学等,曾参与过DeepMind的AlphaCode和OpenAI的GPT-3.5和GPT-4聊天机器人等项目。

在今年7月的直播中,马斯克声称xAI的宏大目标是了解宇宙“到底发生了什么(what the hell is really going on)”,透露xAI将在前沿芯片领域、AI软件方面与特斯拉进行合作,并直言xAI“一定会与OpenAI展开竞争”。



本期资深编辑 周玉华


相关文章

python强大但很危险的一个函数eval()

在 Python 中,eval() 是一个强大但危险的函数,用于执行字符串形式的 Python 表达式。以下是深度解析:一、基础用法result = eval(expression, globals=...

「前端开发」eval() 函数认知和学习以及注意事项

一、简单说明简单说几点吧:eval() 函数在 JavaScript 中是一个非常强大的函数,它可以将传入的字符串当作 JavaScript 代码进行执行。然而,需要明确的是,eval() 并不直接支...

js中eval() 方法的使用以及一些特殊的使用方式

1、eval方法只能在非严格模式中进行使用,在use strict中是不允许使用这个方法的。2、eval函数接收一个参数s,如果s不是字符串,则直接返回s。否则执行s语句。如果s语句执行结果是一个值,...

php中assert和eval的详细介绍(代码示例)

本篇文章给大家带来的内容是关于php中assert和eval的详细介绍(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。assert 判断一个表达式是否成立。返回true o...

越聪明越会撒谎?OpenAI推理模型o3/o4-mini幻觉率翻倍,嘴还很硬

OpenAI 最新发布的推理 AI 模型 o3 和 o4-mini 在性能上又创新高,就在大家期待它能进一步提升日常工作的生产力时,许多用户却发现,它们的幻觉率却比前代模型要高了不少。据 OpenAI...

GPT-4o医学知识覆盖率仅55%?大模型医疗能力“体检报告”来了

MedKGEval团队 投稿量子位 | 公众号 QbitAI医疗大模型知识覆盖度首次被精准量化!在医疗领域,大语言模型(LLM)的潜力令人振奋,但其知识储备是否足够可靠?腾讯优图实验室天衍研究中心的最...