外滩大会上,咱们看到了人工智能五年后的姿态

09-09 370阅读 0评论

机器之心发布

机器之心编辑部

在一些失望者看来,人工智能的开展好像变慢了。

2022 年末,ChatGPT 发布,五天用户注册逾越百万,两个月后月活用户逾越 1 亿,以此为起点,简直每家科技大公司都卷进这场生成式 AI 的风暴傍边,简直每个科技创业者也都企图寻觅起飞的时机,半年融资两轮、一年估值破 10 亿美元的 “黄金年代” 好像又回来了,a16z 创始人 Marc Andreessen 2011 年提出「软件在蚕食国际」(Software is eating the world),在 2023 年,咱们议论的论题变成了「人工智能蚕食国际」(AI is eating the world)。

但是,比及 2024 年,国际好像仍然是那个国际,咱们的日常日子简直没有由于人工智能产生任何改动,运用层面的 “iPhone 时刻” 一直只呈现在各类讲演里,而非咱们的手头上。

在技能端,大模型自身的才干也呈现了许多问题,GPT 5.0 迟迟未能发布,这让咱们疑问 Scaling Law 曲线是否正在放缓,然后质疑 Transformer 架构自身的潜力;大模型的「错觉问题」也一直影响运用层面的落地,乃至有论文认为经过校准的言语模型必定会呈现错觉,与数据质量或许算法架构自身无关 —— 换言之,这简直是个不或许处理的问题。

达观者则认为,这些仅仅当技能爆破真实进入日常国际时分,必定呈现的缓冲期。

技能迸发时分,咱们往往过于振奋,认为未来正加快到来,不过,国际自身有自己的运作规则,需求根底设施来接受,需求运用层面来落地,乃至需求法令、品德和道德层面做好更多预备。在外滩大会上,他们为自己的达观可以找到足够的理由。

九月初,外滩大会在上海举行,上海黄浦世博园区也成了看见 AI 未来趋势的最重要窗口。有人在评论它是否可以疏解孤单,也有人在评论能否帮忙缓解全球变暖,在展区里,仍然有着许多带着创造力的人,来展现他们用 AI 想象的未来。咱们对 AI 的失望或许达观,背面都隐含着咱们对它的等待。

外滩大会上,咱们看到了人工智能五年后的姿态

每个问题都是 AI 持续进化的关键。在外滩大会上,咱们可以看到人工智能仍然在开展,在论坛的评论里,在每个展厅里,咱们可以看到五年后 AI 的样貌。

「算力军备竞赛」或许不会完毕, 但平衡本钱和进步功率越发重要

2020 年,OpenAI 在一篇论文里提出 Scaling law,粗心是大模型的功能与模型的详细结构 —— 深度、宽度和层数 —— 根本无关,首要由核算量、模型参数量和练习数据量三者的巨细有关。

这一结论被称为 AI 范畴的「摩尔定律」,也由于 OpenAI 的成功而成了许多从业者信仰的圭臬。在这一信仰指引下,大模型的开展向着大算力、大参数和大数据的方向开展。从前的 AI 开展首要依据对各类模型的优化,而 Scaling Law 代表着一种新的范式:假使有足够大的算力和数据,咱们便可以处理人工智能开展的问题。

算力军备竞赛也由此开端。李飞飞团队新近发布的《人工智能指数陈述》显现,最新人工智能模型的练习本钱现已到达前史新高。GPT-4 的练习进程耗费了约 7800 万美元的核算资源,谷歌的 Gemini Ultra 模型的练习本钱更是高达 1.91 亿美元。微软也发动「星际之门」超级核算机计划,估计出资将到达 1150 亿美元,而谷歌也敏捷表明将在算力方面有更大方的出资。

烽烟燃不息,假使咱们想要开展更好的大模型,在技能上持续有所突破,那么这场军备竞赛便不或许完毕。不过,假使方针是运用落地和商业闭环,那么落地布置的功率和本钱与技能自身相同重要。所以,优化算力功率,进步数据质量,成了各个企业重视的焦点。

外滩大会上,咱们看到了人工智能五年后的姿态

企业需求重视怎么经过技能立异来完结算力的经济实用,以在不献身功能的情况下,操控投入本钱,而异构核算是完结这一方针的关键技能之一。

异构核算是一种将不同类型和架构的核算单元,如 CPU、GPU、DSP、ASIC、FPGA 等,整合到一个体系中以进步核算功能和能效的技能,可以一起处理多种类型的核算使命,如图形处理、科学核算和 AI 推理,这使得它们十分合适现代数据中心和 AI 运用的需求。

异构核算优势显着。它可以协同多种核算单元,明显进步处理速度和体系吞吐量,特别适用于大规划并行核算使命,并能将使命分配给最合适的核算单元履行,可以优化动力运用功率,下降数据中心的能耗。一起,异构核算支撑灵敏的硬件装备和软件编程,可以依据需求轻松扩展体系才干,开发者也可以依据算法需求挑选最合适的硬件渠道。

未来五年,异构核算需求逐渐处理现有的问题,才干走向遍及。异构核算需求开发者具有跨渠道的编程和优化技能,缺少一致的编程结构和规范,添加了开发难度,导致开发功率受限。此外,尽管长时刻来看本钱更低,但初期硬件出资和研制本钱比较现有老练计划仍然很高,需求大公司首要投入,促进运用。

比起大模型,小模型更或许诞生「大运用」

大约十五年前,移动互联网开端昌盛,也迎来了创业的黄金年代。与之比较,AI 年代创业愈加困难,首要由于本钱更高,需求算力、数据、电力等外界条件,练习大模型所需求的资金,简直没有草根创业者可以担负。在大模型范畴,很或许会呈现「赢家通吃」,终究只剩下几个首要的模型厂商。

不过,AI 是个巨大的生态,在算法、算力、数据和体系等范畴都有着许多时机。

在外滩大会上,一个被评论许多的时机是数据服务商。AI 大模型的功能在很大程度上取决于练习数据的规划和质量。数据数量的添加可以供给更多的样本,使模型可以学习到更多的特征和形式。现在 AI 开展的重要瓶颈,是实际国际的数据挨近干涸,而组成数据仍然存在着许多问题,比方无法反映物理国际的复杂情况等。

所以,一批新式的数据服务商便或许成为 AI 年代的「卖水人」。它需求以更高的功率完结包含数据清洗、数据标示、数据整合和数据安全措施等方面的作业,保证数据的来历牢靠、处理进程通明和成果可验证。高质量的数据为 AI 模型供给学习的根底,然后构成数据飞轮,推进其不断进化和改善。

外滩大会上,咱们看到了人工智能五年后的姿态

更大的创业时机在运用端,特别是在职业范畴。不过,通往职业落地的大门或许并非大模型,而是小模型 / 端侧模型。

严格来说,「小模型」与「端侧模型」并不同等。小模型一般指的是参数规划远少于 GPT-3 或 Llama-13B 的大言语模型,如 1.5B、3B、7B 等;「端智能」则指的是布置在手机、电脑等用户设备上的模型,一般核算资源受限,无法直接运转大模型,所以也要特别规划新的模型。二者方针不同,不过终端设备可以流通运转的,往往都是小模型,因而存在许多重合,咱们也不做详尽的区别。

小模型尽管参数规划小,不过往往专心于某一范畴和使命的规划和优化,在这些方面可以到达乃至逾越大模型的功能,如 Mistral-7B 模型在某些基准测验中逾越了参数量更大的模型,显现出小模型在特定使命上的优势。

由于算力和动力消耗低,小模型更合适落地运用。在端侧,苹果在 iPhone 上运用的 DCLM 模型参数量为 70 亿。傅盛也曾说到,企业专用模型大约只需求百亿参数 —— 作为比照,GPT 4 的参数量高达 1.7 万亿。

小模型的开展将带来端智能的遍及,未来五年首要落地的或许是一批「博士」水平的专业 AI。外滩大会上现已能看到不少很有潜质的产品雏形,触及医疗、动力、教育等范畴。凭借这些专门化的 AI 东西,企业可以更简略地将 AI 技能集合到业务流程中,在职业中落地运用。

职业侧的落地运用也将有助于 AI 自身的进化。各个范畴存在许多数据,在运用 AI 优化决议计划、进步功率的一起,AI 也能取得更高质量的数据,模型和算法也会不断演进与改动,然后推进整个人工智能范畴的开展与老练。

端智能或许是大模型的结局,但手机智能未必是

现在说到端侧模型,往往指的是手机,由于这是咱们顺手可触及的算力最强的设备,不过,手机或许仅仅端智能的过渡阶段。

手机智能的瓶颈很显着,首要是算力缺乏,但更重要的或许是内存缺乏。比较云端服务器,手机等设备的内存容量和存储空间都要小许多,但即便是小模型仍然需求占用许多空间。

内存之外,动力和功耗问题也是一个问题。AI 核算进程功耗巨大,很简略导致电池电量缺乏,设备发热,乃至影响体系整体稳定性。

现在的处理计划一方面是进步手机功能,一方面则是规划更小的模型,以保证在有限的内存、算力、功耗约束下高效运转,如苹果便从 0 构建了专门的小模型,而非对现有的大模型来裁剪。

不过,长时刻来看,或许咱们会有新的 AI Agent,成为人工智能年代下的新式终端形状。

外滩大会上,咱们看到了人工智能五年后的姿态

咱们等待的 AI Agent 并非简略地履行指令,而更像是具身智能理念在人工智能范畴的详细表现,具有更高等级的自主性和智能,是可以在环境中自主举动、感知并做出决议计划的智能实体。

这意味着,AI Agent 不只可以处理虚拟使命,还可以在物理国际中履举动作,供给愈加丰厚和直观的用户体会。这种结合也推进了人工智能在多个范畴的立异运用,如自动驾驶轿车、智能家居、工业自动化等。

咱们与 AI Agent 的交互方法也将产生新的改动。从前期的机器言语到图形用户界面(GUI)、手势操控,再到现在的全模态天然言语交互,人机交互的方法不断演进。全模态交互意味着机器可以经过多种方法(如语音、视觉、触觉等)了解和呼应人类的指令,使得交互愈加天然和直观。

跟着交互方法的演进,机器不再仅仅是东西,而是可以供给陪同、帮忙和情感支撑的同伴;运用进口也不再局限于传统的操作体系或运用程序界面,而是可以经过多种设备和场景进行交互。

这或许不会在 5 年的时刻里产生,不过三到五年之后,更多人会具有可以支撑端侧模型的手机,一批 AI 运用也将全面落地,AI 也将真实跨过距离,走向日子。在这之后,新式终端形状也将走出原型阶段,具有前期运用者,为进一步遍及打下根底。

结语

在瓦特之前半个世纪,蒸汽机技能和相关理论现已老练,但是瓦特让蒸汽机总算可以在生产中运用,而且将它推行到了商场上。即便如此,又过了近半个世纪,蒸汽机在纺织厂遍及,蒸汽轮船也开端成为河运主力,蒸汽机才真实「蚕食国际」。

当下年代,技能传达与开展的时刻周期大大缩短,但咱们仍然需求阅历每个阶段。曩昔两年里,咱们见证了 AI 技能的迸发,未来五年,或许正式找到归于 AI 的纺织厂和蒸汽轮船的时分。

iPhone 在美国诞生,不过移动互联网最昌盛的商场之一是我国。或许未来五年,咱们也能看到更多 AI 运用和场景的迸发,构成昌盛的我国 AI 运用生态。

发表评论

快捷回复: 表情:
评论列表 (暂无评论,370人围观)

还没有评论,来说两句吧...

目录[+]