您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻
大模子慢半拍,字节甘做「嫁衣」?-外盘期货
在大模子甚嚣尘上的当下,一直高抬高打的字节,却一反常态,低调得让人不太习惯。
当百度、阿里、华为、360等着名互联网公司的一把手们亲自挂帅,为大模子站台,并不惜用“智能化时代的劈头”、“科技和商业史上的革命性时刻”来赞誉它时,字节却平静得多。
相关的官宣只有两个,一是4月11日,飞书宣布将推出AI助手“My AI”,二是4月18日,火山引擎推出大模子训练云平台,包罗自研DPU(数据处置器)、新版机械学习平台等系列云产物,以服务于大模子创业公司——字节自研大模子始终未露面。
相反的是,火山引擎总裁谭待公然“答应”,火山引擎不做大模子,将化身赋能者,为大模子客户提供算力等AI基础设施,辅助其做好大模子开发。
此举似乎解释,字节避开了大模子战火,选择以幕后卖水者的身份入局。
只是,在算力、算法、数据这大模子的三要素上均具备优势的字节,为何会选择“韬光养晦”?字节真的会彻底放弃大模子,甘为他人做“嫁衣”吗?
慢一拍的字节大模子
火山引擎不做大模子,或许并不代表字节对大模子无动于衷,这可能是个文字游戏。
现实上,虽然字节从未重振旗鼓得官宣自研大模子,但已经有所部署。
据36Kr在今年2月的报道,字节跳动在大模子上已有结构,会在语言和图像两方面发力,语言大模子团队由字节搜索部门牵头,现在团队规模在十数人左右;图片大模子团队则由产物研发与工程架构手下属的智能创作团队牵头。
另据《晚点LatePost》报道,张一鸣最先看人工智能论文,且时常会和一些字节人士分享论文心得和对ChatGPT的思索。
这解释,字节并不想缺席这场盛宴,但必须认可的是,字节在大模子上的反映确实有点“缓慢”了。
民生证券4月9日宣布的《当大模子不再稀缺》讲述显示,海内至少已有30多家大模子亮相。大部门都在3~4月份官宣,好比3月16日的百度“文心一言”大模子,4月8日的华为盘古系列AI大模子,4月10日的商汤“日日新”大模子,4月11日的阿里“通义千问”大模子......
而据36Kr报道,字节语言大模子团队今年头才确立,预期今年年中推出大模子,字节跳动相关手艺认真人示意,手艺中台在这些领域的探索仍处于初期,尚未成熟。
事实上,大模子竞赛的起点并非今天,而在更早的结构,这方面,字节有些晚了。
对比来看,百度、阿里、华为、腾讯等企业的大模子均在2019年~2021年间就已有雏形,好比,百度在2019年宣布了文心大模子,阿里在2021年宣布了M6大模子,同年华为宣布盘古大模子,这些雏形可以视为近期宣布的类ChatGPT大模子的“基座”。
而字节方面,虽然其AI结构不算晚,字节AI Lab早在2016年就确立,与腾讯统一年,但其似乎并未在大模子上下足功夫。
据《晚点LatePost》报道,一位字节人士称,在去年底ChatGPT泛起前,字节对大模子的投入还对照少,显示之一是,约有100人的字节AI Lab NLP(自然语言处置)组,只有不到10人在研究语言大模子,其他人主要在做翻译和抖音平安等优化。
知乎上一位字节AI Lab工程师的回覆也印证了这一点,他示意,字节AI Lab的主要研究偏向和营业应用有关,好比抖音*、视频和图片审核等。
简朴来说,字节对AI的探索对照务实,主要服务于自家营业,这种务实而非务远的战略,或许反而成了其结构通用大模子的“阻碍”。
而除了晚一步之外,字节对大模子的野望似乎也不是很大。
据《晚点LatePost》报道,字节语言大模子的探索偏向主要与搜索相关,可能会在抖音、TikTok中推出类似微软New Bing的功效;图像大模子则主要服务商业化需求,以辅助字节的广告客户以更低成本制作视频。
另据字母榜报道,有知情人士称,飞书推出的“My AI”背后的大模子是由飞书自行操盘,而非字节大模子团队认真。
从上述信息判断,字节大模子似乎并不设计“大包大揽”,而是与自家部门营业慎密相关,这与百度“文心一言”、阿里“通义千问”等通用大模子有所差异。
好比“文心一言”,在宣布会现场,文心一言展示了五个使用场景,包罗文学创作、商业文案创作、数理推算、中文明白和多模态天生。
“通义千问”的功效则包罗多轮对话、文案创作、逻辑推理、多模态明白、多语言支持等,阿里巴巴团体董事会主席兼首席执行官张勇示意,阿里所有营业包罗天猫、钉钉、高德舆图、淘宝、优酷、盒马等都将接入该模子,应用场景实属普遍。
另一个可以侧面佐证这一点的是,百度和阿里均设计依托自家云平台,向外界开放大模子服务,打造大模子生态。
好比阿里云智能团体CTO周靖人示意,各行各业的生态同伴都可以对千问大模子举行再训练和精调,打造行业专属大模子;百度智能云事业群总裁沈抖也示意,文心一言的能力将通过百度智能云对外提供服务,会率先在媒体、文娱、企业软件等行业落地,场景包罗智能客服、员工培训、巡检日报、知识萃取等。
但字节云却“反其道而行之”,火山引擎宣称只做基础设施服务,纰谬外输出大模子能力。
这意味着,字节正在探索的大模子定位可能并非是开放生态,而是为了增强现有营业的竞争力。
固然,这只是初期,字节大模子的全貌尚未揭开,在字节官宣之前,照样变数难料。
字节为何甘为他人做“嫁衣“?
值得探讨的是,为何字节对百度、阿里那样的通用大模子兴趣不高?火山引擎又为何坚定得不做大模子?
背后缘故原由或许与以下几方面的权衡有关:
其一,通用大模子烧钱,且距离商业落地“遥远”。
训练大模子的一大成本是算力,而算力的要害是芯片,那么,大模子训练需要若干芯片?
参考ChatGPT,美国市场研究机构TrendForce推算称,处置ChatGPT的训练数据需要2万枚A100芯片。网上撒播的一份《AI芯片专家交流纪要》显示,若是是对标ChatGPT的大模子,1万颗A100芯片是入门券。
而据国盛证券估算,按单张A100芯片的价钱为10万元算,大模子训练需要投入约10亿元。
这还只是训练阶段的芯片成本,另有模子推出后的综合运营成本,参考ChatGPT,半导体研究公司SemiAnalysis以为,GPT-3天天大规模服务用户的运营成本高达70万美元,一年则高达2.555亿美元(约17.6亿元人民币),新一代的GPT-4模子只会更烧钱。
除此外,另有数据采集、人工标注等软性成本,加起来可谓“天价”。
像字节这样的大厂或许有资金实力,但穷苦的是,烧钱的效果面临不确定性。
虽然大模子远景可瞻,但距离大规模的商业落地另有不小的距离,现在仍在试探阶段,除了像钉钉、飞书、印象条记等办公场景的详细落地外,其他的应用场景都还停留在展望阶段。
创世同伴CCV合资人梁宇在接受《21世纪经济报道》采访时示意,现在是通用人工智能商业化应用的前夜,AI大模子还没有经由大量的商业包装和训练,需要从业者像园艺师一样去修剪,形成相符行业纪律的商业化产物。
南京:突破与失守之间
IDC中国研究总监卢言霞则以为,大模子落地的不确定性在于,能不能乐成落地,是否真的能产出比之前的AI更好的效果,需要多久才气落地等等。
通用大模子投入产出比的不确定性,或许会让“ROI至上”的字节有所挂念。
其二,时间就是气力,在已往几年内,阿里、百度等企业已将大模子“基座”迭代过几轮,而字节险些是从“零”最先,先发优势已失,追赶不易,不如务实一点。
现在,字节大模子聚焦搜索、视频天生等场景,离自身的营业落地更近,在算法和数据的贮备上*优势,可操作性更高。
火山引擎定位基础设施的服务也是同理,其2021年最先切入IaaS(基础设施服务)模式,至今也有一定积累。
且网上撒播的一份《阿里云AI专家交流纪要0401》显示,在海内大厂的AI算力贮备中,字节排名第二,仅次于阿里。
更主要的是,火山引擎该定位的商业落地十明白确,更容易保障正向现金流。
这是由于大模子训练需要伟大算力支持,而云厂商是公认的算力等基础设施的*载体。
正如阿里巴巴团体董事会主席兼首席执行官张勇所言,大模子是一场“AI 云盘算”的全方位竞争,超万亿参数的大模子研发,是席卷了算法、底层重大算力、网络、大数据、机械学习等诸多领域的庞大系统性工程,需要超大规模AI基础设施的支持。
微软即是先例,微软Azure作为OpenAI的*云供应商,为ChatGPT提供算力和超级盘算系统。除了OpenAI,微软2023财年二季度财报电话集会显示,安盛、联邦快递和H&R Block等公司也都选择Azure来部署和治理其模子。
像微软这样的云厂商被喻为大模子时代的“卖水人”,意为在大模子淘金的人未必能赚到钱,但为淘金人提供基础服务的一定能赚到。
硅谷着名风投A16Z的研究印证了这一点:天生式AI的大量资金最终都稳固地流向了基础设施层,预计天生式AI总收入的10%~20%都流向了云提供商。
总之,商业落地风险小,自身又善于,无怪乎火山引擎云云定位,而捉住这股“盈利”,有时机为其带来新的市场增量。
在现在的云市场中,火山引擎还排不上名次,IDC最新宣布的《中国公有云服务市场(2022 下半年)跟踪》讲述显示,现在公有云服务市场的市场份额排名前五名划分为:阿里云、华为云、中国电信天翼云、腾讯云和AWS,它们总共占有了72%以上的市场份额,其余的云服务厂家份额有限。
或许,以基础服务切入大模子战场的火山引擎,未来有时机借此一搏新的市场名目。
火山引擎或遇天花板
现在看,火山引擎这条路走得还算顺遂。火山引擎总裁谭待示意,现在海内有数十家做大模子的企业,七成已经在火山引擎云上,包罗AI手艺公司MiniMax、智谱AI、昆仑万维、毫末智行等。
关于“七成”的数据口径,谭待的注释是,该“七成”是火山引擎相关客户与第三方机构统计的大模子企业数目之比,而能获得这么多客户是由于机械学习平台解决了算力辅助的问题。
这些客户案例解释,火山引擎在大模子训练领域已有一定驻足之地。
不外,从久远看,火山引擎也面临挑战。
一方面,有能力做大模子的公司事实是少数,客户规模的天花板很显著。
据谭待透露,在火山引擎的大模子客户中,通用大模子公司占比约莫为三分之一,垂直行业公司占比约为三分之二。
划分来看,在通用大模子方面,虽然现在创业者众,但大浪淘沙,最终留下的能有几何?
一位互联网投资人以为,中国版ChatGPT只会在5家公司里发生:BAT 字节 华为,由于大厂有钱有人有场景。
北京航空航天大学人工智能研究院教授吴文峻也有类似看法,其在接受《中新经纬》采访时示意,在现在宣布进军大模子的三四十家企业中,最后能做成的或许不跨越一半。
当客户数目有显著的天花板时,火山引擎的远景可能也有了“瓶颈”。
而在垂直行业模子方面,客户数目虽然许多,但也可能面临阿里云、百度云等平台的“偷袭”。
缘故原由在于,阿里云、百度云均自带通用大模子输出的能力,基于此,企业可更利便的天生垂直模子。
好比阿里云,阿里云智能团体CTO周靖人在此前的媒体采访中示意,阿里云会为企业提供一个专属数据空间,企业将相关信息存入,且不需要做任何数据预处置,便可挪用“通义千问”,一键式天生自己的行业专属大模子。
而若是在没有大模子的火山引擎上做垂直模子训练,企业要费心的事显然更多。
上述投资人以为,垂直模子企业一样平常很少会自己重新做,而是找一个还不错的Pre-Train过的大模子,在此基础上做Instruction Tuning(指令微调)。
在此方面,阿里云等平台可能更有优势。
另一方面,未来云厂商的模式可能是卖模子 卖算力,而不只是卖算力。
Maas模子即服务的时代已经到来,阿里云、百度云不仅支持专属行业模子的天生,还支持中小企业甚至小我私人基于大模子直接开发应用,这就好比小我私人开发者基于安卓操作系统开发App。
换句话说,模子层在未来可能成为新的基础设施。
李彦宏在36Kr专访中更是断言,未来企业在购置云盘算时,不看底层算力,而是看大模子的优劣。
这可能给火山引擎带来一定袭击,由于当大量中小企业或小我私人基于阿里云、百度云开发应用时,云厂商背后的算力也获得了间接挪用,从而规模效应平摊了算力成本,最终使其基础设施层面的服务也更具价钱优势,这颇有点“降维袭击”的意思。
事实上,“价钱战”已经最先了。
4月26日,在2023阿里云互助同伴大会上,阿里云推出了史上*规模的降价:焦点产物价钱全线下调,降幅最高至50%。
不外,火山引擎对此似乎对照乐观,至少现阶段云云。
其逻辑在于,一来火山引擎拿到的时间窗口还对照长,谭待以为,海内距离全球最高水平的大模子还需要对照长的时间,现阶段不能能用三四十分的模子去做应用,也不能能做好应用。
二来,火山引擎坚信未来是多云多模子时代,企业会阻止单一依赖,而选择使用多家云服务,同时,各行业都有自己高质量的私有语料,会形成多模子生态。
言下之意可能是,市场很大,火山引擎总会有驻足之地。
总而言之,大模子市场的未来扑朔迷离,介入其中的任何一员的前途均可能有变数,“缺失”大模子的火山引擎云云,走务实蹊径的字节大模子也云云。