您的位置:主页 > 公司动态 > 每日行情 > 每日行情
OpenAI 和谷歌最怕的,是一张「开源笑容」-商品期
「我们没有护城河,OpenAI 也没有。」
在最近泄露的一份文件中,一位谷歌内部的研究职员表达了这样的看法。这位研究职员以为,在这场猛烈的 AI 竞赛中,虽然谷歌与 OpenAI 在你追我赶,但真正的赢家未必会在这两家中发生,由于有股第三方气力正在崛起。
这个气力就是「开源社区」,它才是谷歌和 OpenAI *的敌人。
而开源社区的顶流,当属 Hugging Face 了。作为一个 AI 领域的 Github,它提供了大量高质量的开源模子与工具,将研发功效*水平地惠及社区,极大地降低了 AI 的手艺门槛,推进了 AI 的「民主化」历程。
它的首创人之一,Clément 还曾果然示意:「在 NLP 或者机械学习领域,最坏的情形,就是要与整个科学界和开源界竞争。因此,我们不再试图竞争,转而选择为开源界和科学界赋能。」
Hugging Face 建立于 2016 年,几年间连获 5 轮融资,现在估值已经飙到 20 亿美元,Github 上的星标数目已经跨越了 9.8w,稳居热门资源库之列。
那么这家公司是做什么的?是若何逆袭成为开源界的「顶流」的? 它的生长模式又是怎样的呢?
1、NLP 开启逆袭之路
Hugging Face 是一家以自然语言处置 (NLP) 手艺为焦点的 AI 初创公司。
它是由法国延续创业者 Clément Delangue(曾开办条记平台 VideoNot.es,媒体监测平台 mention 以及被 Google 收购的移动开发平台 Moodstocks 等项目)和 Thomas Wolf、Julien Chaumond 一起开办的,于 2016 年确立,总部设在美国纽约。
其中的两位首创人 Clément Delangue 和 Thomas Wolf 都是自然语言处置领域的专家。在不停推进 Hugging Face 的生长的历程中,他们被视为现代 NLP 领域的先锋。
他们开办 Hugging Face 的初衷,是为年轻人带来一个「娱乐型」的「开放领域谈天机械人」,就像科幻影戏《Her》内里的 AI 那样,可以跟人谈天气、同伙、恋爱和体育竞赛等种种话题。人人可以在无聊的时刻跟它聊八卦、问它问题、让它天生一些有趣的图片之类的事情。
也正因云云,Hugging Face 的名字泉源于一个张开双手的可爱笑容 emoji。
2017 年 3 月 9 号,Hugging Face App 在 iOS App Store 正式推出,就获得了不少关注,还拿到了包罗 SV Angel、NBA 球星杜兰特等投资人在内的 120 万美元的天使投资。
为了训练这个谈天机械人的自然语言处置(NLP)能力,Hugging Face 构建了一个资源库来容纳种种机械学习模子和种种类型的数据库,包罗辅助训练谈天机械人检测文本新闻情绪、天生连贯的响应、明晰差异对话主题等。
同时,Hugging Face 团队在 GitHub 上将此库的免费部门开源,目的是从用户共创中获得开发灵感。
到了 2018 年,Hugging Face 仍然不温不火,便最先免费在线分享应用程序的底层代码。这一行为立刻收到了谷歌、微软等业内着名科技公司的研究职员的努力响应,他们最先将这些代码用于 AI 应用程序,这个笑容 emoji 也最先被宽大 AI 开发者们所熟知。
恰巧同年,谷歌推出基于双向 Transformer 的大规模预训练语言模子 BERT,开启了 AI 模子的「内卷时代」。
在这样的大环境下,Hugging Face 做起了提供 AI 模子的服务,随之迎来了自己的「黄金时代」。
它先是开源了 PyTorch-BERT;随即,又整合了它先前孝顺的 NLP 领域的预训练模子,公布了 Transformers 库。
Transformers 库提供了数以千计的预训练模子,支持 100 多种语言的文天职类、信息抽取、问答、摘要、翻译、文本天生。借助 Transformers 库,开发者可以便捷地使用 BERT、GPT、XLNet、T5 、DistilBERT 等 NLP 大模子,来完成文天职类、文本总结、文本天生、信息抽取、自动 QA 等 AI 义务,节约大量的时间和盘算资源。
简而言之,Transformers 库提供直接可用的模子,无需企业再度开发;因此,众多企业最先借助 Transformers 库,将模子应用到产物开发和事情流程中。
Transformers 库也因此迅速地盛行起来,成为了 GitHub 史上增进最快的 AI 项目。
图片来自于 Lux Capital
Hugging Face 的首创人之一 Clément Delangue 也不禁感伤,「我们公布器械时没有思量太多,而社区的爆炸式增进甚至让我们感应惊讶。」
面临云云多的开发者,Hugging Face 顺理成章地确立了自己的社区,Hugging Face Hub;同时,调整产物战略,不再局限于自然语言处置,而是将机械学习的差异领域举行融合,探索确立新的用例,着手构建一套完整的开源产物矩阵。
停止 2023 年 4 月,Hugging Face 共享了 16,6894 个训练模子,2,6900 个数据集,涵盖 NLP、语音、生物学、时间序列、盘算机视觉、强化学习等领域,搭建了完整的 AI 开发生态。
这大大降低了相关研究与应用的门槛,让 Hugging Face 成为 AI 社区*影响力的手艺供应商。
现在,这些模子已经服务了数万家企业举行资源开发,辅助科研职员和相关从业职员更好地构建模子、更好地介入到产物和事情流程中,其中不乏 Meta、亚马逊、微软、谷歌等着名 AI 团队。
在资源市场,Hugging Face 也同样备受青睐。
在 2022 年 5 月,团队完成了由 Lux Capital 领投、红杉资源参投的 1 亿美元 C 轮融资,估值狂飙到 20 亿美元。
面临资源的追捧,Hugging Face 的首创人显示的极其镇定,示意拒绝了多个「有意义的收购邀约」,而且不会像 GitHub 那样出售自己的营业。关于 Hugging Face 的未来,它的首创人尚有一些有趣的想法:「我们希望成为*家以神色符号上市的公司,而不是三个字母的股票代码。」
2、AI 大模子的 Github
依附开源获得了万众瞩目的 Hugging Face,也格外注重社区的建设,而刚刚降生不久的 Hugging Face Hub,现在俨然已经成为 AI 开发者的大本营。
Hugging Face Hub 是一个探索、实验、相助,并确立机械学习手艺的中央场所。在这里任何人都可以分享和探索模子、数据集等,人人轻松相助,配合构建机械学习模子,Hugging Face Hub 也因此被称做「机械学习之家」。
它是 Hugging Face 坚持「开源」的产物,也是它的焦点。正如官网的宣传语所述:AI 社区,建设未来。
王者荣耀雪纺裙卖1680元,真当女玩家是大冤种?
Hugging Face 的首创人曾果然示意「Hugging Face 的目的是通过工具和开发者社区,让更多的人使用自然语言处置工具,杀青他们的创新目的,让自然语言处置手艺更容易使用和接见。」
他还弥补说,「没有任何一家公司,包罗科技巨头,能够独自『解决 AI 问题』,而我们实现这一目的的*途径,是通过以社区为中央的方式,分享知识和资源。」
因此,公司致力于在 Hugging Face Hub 上确立*的模子、数据集、演示和指标的开源聚集,以使每小我私人都能行使机械学习举行探索、实验、相助和构建手艺,从而实现 AI「民主化」的目的。
现在,Hugging Face Hub 提供跨越 12 万个模子(Models)、2 万个数据集(Datasets) 和 5 万个演示应用程序(Spaces),而且所有这些都是开源、果然、免费的。
Hugging Face Hub 对所有机械学习模子开放,并获得 Transformers 、 Flair、Asteroid、ESPnet、Pyannote 等自然语言处置库的支持,其中,最焦点的自然语言处置库是 Transformers 库。
Transformers 库支持 PyTorch、TensorFlow 和 JAX 之间的框架互操作性,这确保了在模子生命周期的每个阶段使用差异框架的天真性。而且,通过 Inference API(推理 API),用户可以直接使用 Hugging Face 开发的模子与数据集,举行推理、迁徙学习,这让Transformers 框架在性能与易用性上到达业界*水平,彻底改变了深度学习在 NLP 领域的生长模式。
此外,该平台还提供了一些适用工具,如模子版本控制、测试集成、共享和协作等,可以辅助开发职员更好地治理和共享模子和数据集。
因此,在 Hugging Face Hub,任何开发者或者工程团队都可以通过接口,使用数千个模子的推理 API,轻松下载和训练*进的预训练模子,完成差异模式的常见义务,例如自然语言处置、盘算机视觉、音频、多模态等,在几分钟内构建自己的机械学习驱动的应用程序,省去了重新最先训练模子,所需的大量时间和资源。
在此基础上,他们还可以在自己的账号下确立自己的客栈,用于存储和分享已经训练好的模子、数据集和剧本,同时与壮大的社区分享交流,轻松协作完成 ML 事情流程。
简而言之,Hugging Face Hub 为研究者提供了一个平台,去展示那些他们想要分享的模子,测试他人的模子,以此来深入研究这些模子的内部架构,配合促进 ML 的生长。而此前,AI 对前端开发者来说似乎遥不能及,究竟到现在为止,只有少数代码天生的 AI 系统向民众免费开放。
也正因云云,Hugging Face 决议在社区提供开源模子和 API 来改变这种状态,自动肩负起 AI 科研走向应用的这个历程中庞大、细碎的事情,使得任何 AI 从业者都可以便捷地使用这些研究模子和资源。用 Hugging Face 自己的话来讲,他们所做的事情,就是要架起 AI 科研和应用之间的桥梁。
除了提供便利,Hugging Face 还努力接纳措施强化 Hub 的平安性,确保用户的代码、模子和数据是平安的,让用户放心使用。
例如,在模子库配备模子卡,以见告用户每个模子的限制和私见,从而促进这些模子被卖力任地使用和开发;在数据集设置接见控制功效,允许组织和小我私人可以出于允许和隐私思量,确立私人数据集,而且可以自行处置其他用户的接见请求。
还值得一提的是,为了进一步使自然语言处置手艺「民主化」,Hugging face Hub 上还开设了 NLP 课程——Hugging Face course。
该课程将使用 Hugging Face 生态系统中的数据库(Hugging Face Transformers、Hugging Face Datasets、Hugging Face Tokenizers 和 Hugging Face Accelerate),解说自然语言处置 (NLP) 的有关知识。它是完全免费的,甚至没有广告。
简而言之,Hugging Face Hub 就像是机械学习领域的 GitHub。一个由社区开发者驱动的平台,提供大量资源,闪开发职员可以在机械学习(ML)模子、数据集和 ML 应用程序上,不停探索、创新和相互协作,通太过享知识和资源以加速和推进 AI 生长。
3、「开源」动员「商业」
那么问题来了,一家提供「平台社区」的「开源」公司,又是若何盈利的呢?
首先,「开源」就是一个准确的决议。
Hugging Face 依附开源项目 Transformers,积累了伟大的影响力,群集了宽大开发者构建了重大的社区 Hugging Face Hub,也赢得了客户与投资者的信托,这使得它的商业化转型水到渠成。
对此,红杉资源合资人 Pat Grady 也示意,「他们优先思量的是应用,而不是变现,我以为这是准确的做法。他们看到了 Transformer 模子在 NLP 之外的应用方式,看到了成为 GitHub 的时机,这不仅是面向 NLP,而且会延伸到机械学习的每个领域。」
而且,纵观已往十年,市场上初创公司的创业历程,会发现开源模式的商业可行性获得过有力的印证。像 MongoDB、Elastic、Confluent 等,都是收入增进最快的开源公司,它们都实现了盈收,而且还在市场中存活了下来。
Hugging Face 的首创人之一,Clément 也因此坚信,「初创公司可以通过某种方式为开放的社区赋能,此种方式发生的价值,比通过搭建一个专有工具,发生的价值凌驾上千倍。」
甚至果然示意,「思量到开源机械学习的价值和它的主流职位,其使用量就是递延收入。机械学习会成为手艺开发的默认方式,而且 Hugging Face 会成为这方面的头号平台,并缔造出数十亿美元的收入。」
因此,Hugging Face 选择了「开源动员商业」,这一商业化生长路径,并在 2021 年最先提供付费功效。
现在,Hugging Face 的盈利营业主要有三类:
付费制会员:提供加倍优质的服务和社区体验,来获得收益;
数据托管:凭证差异参数需求,提供差其余按小时收费托管服务;
AI 解决方案服务:现在的主打产物,围绕 NLP、Vision 等偏向为客户提供定制化解决方案,以获得手艺服务用度。
值得一提的是,从 2020 年最先,Hugging Face 就最先做面向企业的定制自然语言模子,并推出了包罗 AutoTrain、Inference API & Infinity、Private Hub、Expert Support 等,针对差异开发者类型的个性化产物。
现在,1000 多家公司已经成为了 Hugging Face 的付费客户,主要是大型企业,包罗英特尔、高通、辉瑞、彭博社和 eBay。
2021 年,Hugging Face 已经实现收入 1 万万美元,从数据上来看,Hugging Face 这套的「开源动员商业」的计谋是乐成的。
这也印证了 Hugging Face 的 CEO,Clément 所说的,「公司不需要从缔造的价值中获取 100% 的盈利,只需将其中 1% 的价值变现,但即便只是 1%,也足够让你成为一家高市值的公司。」
简而言之,Hugging Face 依附开源社区积累影响力,尔后逐步向 SaaS 产物和企业服务拓展。这种渐进式的转型,让 Hugging Face 在开源和商业化之间,取得了优越的平衡,也是其能取得乐成的主要缘故原由。这种生长计谋也让 Hugging Face 成为了 AI 界独树一帜的存在,并为其他 AI 初创公司树立楷模。
然则,开源生态也有它自己的软肋,由于商业化的生长很可能会危险到自然生长的社区环境。对此,Hugging Face 的做法是增强对手艺的管控,维护自己的开源生态;同时,向科研领域深挖。
「机械学习手艺仍然还处于早期生长阶段,开源社区的潜力是伟大的。在未来 5 到 10 年,我们一定还会看到更多开源机械学习公司的崛起。」
Hugging Face 的 CEO Clément 说道。