马斯克布局TruthGPT大模型

来源:电子工程专辑      时间:2023-07-23    

当地时间7月12日,全球首富埃隆·马斯克宣布成立xAI公司。据称,xAI公司目标是了解宇宙的真实本质,即马斯克一直倡导的“AI威胁论”——“让超级人工智能保持与人类和谐共处”。

实际上,除了其公开的发展愿景和目标之外,马斯克成立xAI公司的另一个重要目的在于“防止某个公司一家独大”,即公开叫板目前引领行业的Open AI公司以及谷歌和微软。通过成立xAI公司,以及涉入大模型,马斯克将开创自己的“人工智能帝国”。

近日,马斯克在xAI公司会议上透露的信息也证实了这一点。他透露,特斯拉正在自主研发芯片,但不会将其称为GPU或使用类似100s、H100s等名称来描述它。他还表示,特斯拉还在开发名为Dojo的超级计算机,目前主要用于人工智能机器学习和计算机视觉培训目的,但未来将向大模型方向发展。

据悉,尽管xAI公司是一个独立的实体,但会与特斯拉以及马斯克旗下其他公司进行密切的合作。毫无疑问,xAI公司未来的研究成果将在自动驾驶、智能机器人、脑机接口等方面得到深度应用。可以说,马斯克成立xAI公司,是在下一盘“人工智能大棋“。

为何锚定大模型?

关于成立xAI公司,马斯克声称本质目的是拯救人类,其已经在非常多的场合强调了AI对人类未来的威胁,甚至要求将人工智能带来的风险与流行病和核战争等风险被优先考虑。

今年3月,马斯克还曾联合上千名行业顶尖人士叫停OpenAI的GPT-5的开发,并呼吁相关监管规则尽快出台。最近,在2023世界人工智能大会上马斯克再次重申对AI监管的必要性。

然而,马斯克的人工智能威胁论,也遭到了很多学者和伦理学家的反对,且认为,过多关注人工智能的威胁,会分散人们对某些算法的注意力。

在这一观点上,微软联合创始人比尔·盖茨就表示,人工智能技术需要的监管是“速度限制和安全带”。他承认,生成式AI技术的出现可能会导致深度伪造、算法偏见和学校作弊等问题,但他预测该技术带来的问题是可以解决的。

不过,马斯克一方面强调人工智能的威胁,但另一方面又早早布局大模型,正所谓“嘴硬、身体很真实“。

图源:OpenAI官网

早在2015年,马斯克就与Sam Altman等9位个人和机构总共捐出10亿美元作为启动资金,在旧金山联合创立了OpenAI。其中,Sam Altman和马斯克出任OpenAI联席董事长。

在OpenAI成立之初,Sam Altman和马斯克目的主要有两个:一是避免人类将来被AI干掉;二是避免科技大公司垄断这项技术。第一个目的很好理解,毕竟马斯克一直强调这一点。然而,第二个目的其实是Sam Altman和马斯克认为被谷歌收购的DeepMind是最有可能率先开发AGI的企业,加之谷歌这样的科技巨头的技术实力,完全有能力垄断这种“先进又危险“的技术。

据悉,从2015年成立Open AI之后,马斯克个人就捐出了一亿美元。2017年,马斯克发现Open AI的进展远远落后于谷歌,因此他提出了一个方案,由他来掌控Open AI并亲自运营。

然而,包括Sam Altman在内的其他联合创始人和董事会拒绝了马斯克这一提议。除了当时马斯克疲于应对特斯拉量产和火箭制造等一系列事情之外,特斯拉研究的自动驾驶人工智能的应用与OpenAI是有相关利益冲突的。

在这场权力斗争中,马斯克最终落败,但他也挖走了OpenAI最优秀的人才之一——Andrei Karpathy,其加入特斯拉成为了自主驾驶计划的架构师。

此前,马斯克承诺向OpenA提供大约10亿美元,但随着他的离开,该承诺也没有兑现。

此后,OpenAI在傍上微软之后,不仅得到了100亿美元的资金支持,还在微软的帮助下,建立了一台超级计算机来训练大规模的模型,最终创造了ChatGPT和图像生成器DALL-E。ChatGPT爆火甚至将谷歌打了个措手不及。

不过,此时的OpenAI也变了“颜色”,与成立的初衷完全背道而驰,不仅没有开源,而且受到微软深度控制。这也是自ChatGPT诞生以来马斯克也没少"针对"OpenAI的原因。

然而,ChatGPT红极一时,越来越多科技企业纷纷布局大模型,至此马斯克也不可能无动于衷了。

建立可控的“TruthGPT

尽管马斯克曾多次反对AI,从其投资布局来看,其反对的可能不是AI,而是OpenAI和GPT。但不可否认马斯克是最早意识到AI潜在威胁的科技巨头之一。

早在2014年,他就认为,如果不加以控制和谨慎对待,智能机器有可能在某个时间点上迅速超越人类智力,成为不受人类控制的独立存在。而到那时,人类很可能成为机器的从属品或工具,被迫去服务机器的目的。

不过,在当时弱人工智能时代,这一观点不被大家认同也在情理之中。然而,2017年Google工程师创建了变换器网络(Transformer)架构,将AI的智能水平提升了一大截。2018年底谷歌更是推出了BERT模型,竟然能够理解人类的语言,甚至在许多被认为是只有人类才能够做到的任务中,都超越了人类,比如阅读理解。

这一创新成果刺激了大模型的进一步迭代升级,也吸引了更多科技巨头的进入这一领域。其中,由马斯克、Sam Altman以及一众人工智能方面最顶尖的专家共同成立的OpenAI更是拔得头筹,在2022年底推出了ChatGPT,引发了人工智能发展的热潮。

ChatGPT是基于GPT-4架构的创新人工智能语言模型,在多种语言和应用场景中表现出卓越的性能,成为现代人工智能领域的一大创新。ChatGPT推出仅仅2个月,月活跃用户就成功过亿,成为历史上增长最快的消费者应用程序。

对于ChatGPT的爆火,马斯克也是惊奇于其超强的智能水平,但此时他已经离开了联合创办的OpenAI公司。而基于“未受管制的人工智能发展可能会对人类社会造成巨大威胁”论点,马斯克在今年2月在在Twitter发了个消息“What we need is TruthGPT”。

尽管马斯克的“防止数十年后超级人工智能毁灭人类“这一论点在目前看来,的确有些“骇人听闻”,但ChatGPT在实际应用中确实也产生了一些负面影响,比如信息不准确、误导信息、侵犯隐私、诈骗等。

GPT-3.5和GPT-4对比   图源:OpenAI官网

而马斯克也提出要研究“对齐”技术,来加强人工智能对人类的认同,并防止人工智能“为非作歹”。当然,更重要的是马斯克所提到的“防止数十年后超级人工智能毁灭人类”。

因此,建立一个令人信服、可控的“TruthGPT”就成为马斯克的人工智能新目标。

今年4月,马斯克就暗示,将推出一款被称为“TruthGPT”的聊天机器人,“我将开始筹划一些我称之为‘TruthGPT’的东西,或者一种试图理解宇宙本质的、最大程度寻求真相的人工智能。” “TruthGPT可能是通往安全的最佳途径,不太可能消灭人类。”

而新成立的xAI公司不仅可以帮助马斯克实现推出ChatGPT竞品的构想,以挑战目前微软和谷歌在AI的地位,而且又能实现其标榜的“阻止人工智能毁灭人类”的崇高目标。

由此可见,OpenAI是马斯克挑战谷歌这样的AI巨头的第一次尝试;xAI公司将是马斯克挑战大模型的第二次尝试。

按照马斯克以及创始团队的说法,xAI公司的目标是构建一个强大的AGI(人工通用智能),目的在于理解宇宙,其方法是构建一个"最大程度的好奇"和"寻求真理"的AGI,并试图最小化你认为的真相和实际真相之间的差异。

对于“TruthGPT”,马斯克表示,2029年AGI会到来!

马斯克的“大模型”新战略

对于xAI公司创始团队,马斯克表示,“xAI由拥有人工智能方面的天才科学家创立。他们对人工智能技术有着非同寻常的热情和远见。很快,世人将看到xAI 公司的迅速成长,惊叹其强大的研发能力。” “在我 xAI 的团队中,东方血统的人数占了40%还多!”

据悉,xAI公司的团队成员包括谷歌旗下DeepMind的前明星工程师伊戈尔·巴布什金(Igor Babuschkin),以及5位华人数据科学家,其中也有来自清华大学的校友。

创始成员中大部分曾就职于DeepMind、OpenAI、谷歌研究院、微软研究院、推特(Twitter)以及特斯拉,参与项目包括DeepMind的AlphaCode和OpenAI的GPT-3.5和GPT-4聊天机器人等。

其中,5位OpenAI华人科学家分别是吴宇怀、杨格、张国栋、戴子航以及Jimmy Ba。杨格是xAI的联合创始人,他曾就职于微软研究院,现在正研发TensorPrograms理论和扩展神经网络的实践;戴子航是前谷歌大脑研究员,曾在百度美国分公司进行实习。

xAI联合创始人杨格也表示,xAI将深入研究“深度学习的数学”,这是人工智能的一个侧面,并为大型神经网络开发“万有理论”,将人工智能推向新高度。

毫无疑问,xAI公司创立,除了与微软、谷歌这些科技巨头竞争之外,还将与马斯克旗下的企业形成联动,加快大模型的落地应用。而xAI 将使用公开推文来训练其人工智能模型,并且还可能与特斯拉在人工智能软件方面进行合作。马斯克也表示,这种关系将是互惠互利的,并且可以加速特斯拉在自动驾驶汽车领域的进步。

值得一提的是,最近,特斯拉人工智能团队发布了定制超级计算机平台Dojo的产品进展时间线,将于7月投入生产;到2024年初,Dojo将成为全球最先进的5台超级计算机之一。

从本质上来讲,Dojo是一种可组合的规模化超级计算机,与超算系统不同,其是一套完全可定制架构,全面涵盖计算、网络、输入/输出(I/O)芯片,乃至指令集架构(ISA)、供电、封装和冷却。所有这些都服务于同一个目标:大规模运行定制化机器学习训练算法。

无疑,超级计算机平台Dojo将对特斯拉的FSD(Full Self-Drive,完全自动驾驶)产生重要影响。特斯拉方面也表示,一旦Dojo启动并运行,特斯拉完全自动驾驶系统FSD Beta将呈现“指数级提升”。

图源:特斯拉官网

据悉,Dojo超级计算机将在2024年10月达到100exaflops的惊人水平,将加速特斯拉Autopilot和全自动驾驶系统的学习和改进。同时,Dojo也将为特斯拉的智能机器人Optimus提供计算支持。Optimus是特斯拉今年刚刚发布的一款类人形机器人,旨在执行一些无聊、重复或危险的任务。

今年4月,有知情人士透露,马斯克在推特内部启动了一项人工智能项目,不仅为此购买了约1万个GPU(图形处理器),还从谷歌的人工智能部门DeepMind招募了人才。

据悉,推特版GPT已经在推进过程中,且基于推特本身拥有的海量数据,创建一个生成式人工智能,存在很大的优势。据此,也有人分析,马斯克此举可以改进推特的搜索功能和广告营销收益。

另外,马斯克旗下Neura Link脑机接口技术也可能受益于大模型的开发。

因此,马斯克透露特斯拉自研GPU,以及开发Dojo的超级计算机且向大模型方向发展之后,引发了对于特斯拉在人工智能领域的布局的猜测。而马斯克向大模型方向发力,也可以说是下一盘“大棋”。

全部评论


登陆后方可参与评论