登录  | 加入社区

黑狼游客您好!登录后享受更多精彩

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

查看: 773|回复: 0

科技巨头加快入场算力战局,毕竟是什么在推动「生手」自研芯片 ...

[复制链接]

959

主题

959

帖子

0

现金

黑狼菜鸟

Rank: 1

积分
0
发表于 2020-12-24 03:49:04 来自手机 | 显示全部楼层 |阅读模式 来自 法国

原标题:科技巨头加快入场算力战局,毕竟是什么在推动「生手」自研芯片

呆板之心原创

作者:黄义勋

上周,字节跳动开始自研云端 AI 芯片和 Arm 服务器芯片的消息引人关注。新兴科技巨头,是否已经到了全面自研芯片的期间?背后最重要的缘故原由又是什么?

据外国媒体报道,互联网科技巨头亚马逊正开始探索 RISC-V,以思量替换 Arm 处置惩罚器的方案,由于后者正在被英伟达收购。

此前,亚马逊已经拥有了本身专属的 AWS 数据中央芯片、人工智能芯片以及各类移动智能装备上的 Arm 芯片。

像亚马逊一样,国表里许多此前只涉及软件和互联网的科技巨头都拥有了自主研发的芯片,而且取得了经市场验证的精良结果。

谷歌的 TPU 和自身的 TensorFlow、算力平台共同构成了全天下最好的人工智能技能生态;亚马逊的 Inferentia 集群比英伟达 T4 低落了 25% 耽误和 30% 本钱。

其他互联网巨头也正在加快入场,微软客岁12月份表现正在研发Arm芯片;字节跳动近期也开始芯片人才的雇用,探索Arm芯片。字节跳动的相干负责人回应媒体扣问时证明,「是在组建相干团队,在AI芯片范畴做一些探索。」

字节跳动官网上芯片工程师的雇用信息。

J212e1gfU12cN211.jpg

在外界看来,互联网巨头自研芯片已经成为一定,这势必会对本来以芯片为主业的半导体巨头和芯片创业公司产生较大影响。

在这个过程中,必要搞明确一个最焦点的题目——互联网巨头为什么要本身造芯片,以及在何种环境下才会选择自研芯片。

业务界限的连续扩展,数据量的激增,人工智能技能的发展,让互联网巨头对芯片的需求连续增长。

同时,外部的芯片计划工具和 IP 服务也渐渐变强,芯片财产链的美满为巨头自主做芯片提供了成熟的财产底子。博通每年都会给客户提供大量定制芯片;苹果引人关注的 M1 背后,实在也有许多其他公司的身影。这种财产链协同和互助资助互联网巨头低落了研发芯片的门槛。

睁开全文

对盘算需求的增长和制造门槛的低落只是提供了一个须要配景,在应用层面上,同一个使命会有无数种硬件办理方案,互联网巨头们的工作就是选择哪种硬件方案以及是否必要本身做,自研芯片只是浩繁选择中的一项。他们真正关心的是最具性价比的办理盘算使命,而非必须要有本身的芯片。

而决议的唯一依据就是差别方案的本钱与收益对比,也就是找到 ROI 最大的方案。

自主研发芯片有着非常高的团体研发本钱,包罗购买 IP、职员本钱、实行和流片等。互联网巨头们大部门的乐成履历都会合在软件和互联网范畴,他们进入芯片范畴也是从零开始,没有太多可以节流的本钱。

湾区一位芯片专家先容说,谷歌开始做芯片时,从博通挖了许多 ASCI 业务的人,从上到下组建一个全新范畴的专业团队和运营体系,而这种体系与公司此前所善于的是完全差别的,这又带来在企业文化和管理上的额外本钱和风险。

自主研发芯片的高投入决定了它只实用于可以带来更高收益的应用场景——芯片能和公司自身业务体系、网络布局和练习框架等精密联合,实现盘算本钱的明显降落,产物性能和和用户体验的明显增长。

只有如许,自研芯片才气得到最高的 ROI,企业选择自研方案才故意义。下面以 Arm 芯片、练习芯片、Codec 和 Smart NIC 等四种芯片为例。

众所周知,摩尔定律的速率已经开始变缓,数据中央同构体系下基于 x86 的硬件本钱没办法继承降落。想要实现盘算本钱的降落,只能将负载拆分,然后用差别架构和处置惩罚器来分别处置惩罚,许多负载又是和企业自身网络布局强相干的,那企业就必要针对这些使命去定制芯片,在这种环境下,企业自主研发 Arm 芯片就是有助于节流本钱的。

除了与网络布局强相干,与练习框架强相干也会促使公司自主研发芯片。好比有 TensorFlow 的谷歌就肯定要去做 TPU,由于谷歌是通过公有云为用户提供算力租赁和模子练习服务,而一个模子在其平台练习完成所必要的时间和费用是用户决定是否利用该平台的最重要因素。谷歌 TPU 与 TensorFlow、云盘算的强协同,会带来远超通用练习工具的结果,以及更低的本钱。

在客岁的 MLPerf 基准测试效果中,谷歌的 TPU 集群冲破了 8 项测试记录中的 6 项。在 4096 块 TPU 的加持下,谷歌的超等盘算机可以在 33 秒内练习 ResNet-50、BERT、Transformer、SSD 等模子。在利用 TensorFlow 框架时,BERT 的练习时间收缩到 23 秒。

ncToLTREt6oCGaqL.jpg

在一个图像分类使命中,用 ImageNet 数据集练习 ResNet-50 v1.5 到达 75.90% 的正确率,256 个第四代 TPUs 可以在 1.82 分钟内完成,这险些相称于 768 个英伟达 A100 显卡和 192 个 AMD Epyc 7742 CPU 内核(1.06 分钟)的速率。

单从芯片架构上来说,TPU 和 GPU 不会产生云云大差别。谷歌 TPU 集群比 A100 快这么多的缘故原由是,用于练习的芯片与公司自身的网络布局和练习框架强相干,TPU 不但支持自身的网络布局,还向上支持本身的练习框架,谷歌知道 TensorFlow 怎样去做加快,以是结果肯定会优于通用的 GPU。那末了带来的效果就是,用户在谷歌的平台上得到了更高性价比的服务,谷歌更好的创建人工智能技能生态。以是,谷歌自主研发 TPU 就是故意义的。

华为也是此类环境,他们拥有升腾 910、MindSpore 和云盘算,因此,华为的人工智能技能平台就拥有了竞争力。徐直军曾表现,昇腾 910、MindSpore 的推出,标记着华为已完玉成栈全场景AI办理方案(Portfolio)的构建,也标记着华为 AI 战略的实行进入了新的阶段。

对于其他范例的定制芯片也是云云,好比 Facebook 做本身的 Codec,这是由于在 Facebook 自身的业务和软件体系下,上行下行的编解码处置惩罚非常紧张。比起利用通用 CPU ,Facebook 选择本身开辟 Codec 就更划算。

另有智能网卡 Smart NIC,险些全部的互联网巨头都会自主研发,尤其是提供公有云服务的企业。由于公有云涉及巨大的网络布局,企业必要去匹配负载和网卡,以是每家企业对 Smart NIC 的需求都是个性化的,不具有通用性,必要定制化,这也是英伟达的 DPU 在市场中体现并欠好的缘故原由。

另有一个紧张因素是互联网巨头都具有规模效应,他们拥有最巨大的机房,为数以万万计的用户提供服务,只要性能有微小提拔,大概代价有微小降落,就会为用户带来巨大代价。

总结来说,对于互联网巨头,假如芯片的应用场景和自身业务及软件强相干,自身对此有个性化需求,终极能通过规模效应最大化收益,那他们就会选择自主研发。

在其他场景下,当巨头的芯片需求不是个性化的,所需芯片和自身业务、网络拓扑布局和软件体系没有强相干性,大概说他们必要的是通用芯片时,那巨头们就无法通过定制来低落本钱,也就没有须要为了一个非定制需求去负担通用芯片的全部研发本钱。

更加公道的方式应该是向其他半导体公司购买,大概战略投资芯片创业公司举行结构,以与其他客户或投资机构共同分摊研发本钱。x86 CPU 和推理芯片就是属于这个范畴。

许多公司是没办法通过优化自身的拓扑布局和软件体系来实现 x86 CPU 性价比的大幅提拔的,以是最佳选择就是直接向英特尔购买。

推理芯片也是云云,它在人工智能范畴的通用性很强,必要根据算法来举行调解和演进,必要较好的可编程性,那这类芯片就和巨头自身的网络拓扑布局和练习框架并没有那么直接的关系,大企业也就无法通过深度定制和自主研发大幅低落本钱或提拔性能,最好的选择也是购买及投资。

亚马逊在自主研发与业务相干芯片的同时,也投资了通用人工智能芯片初创公司 Syntiant。字节跳动一方面探索自主研发 Arm 芯片,另一方面,他们投资的一家芯片公司的重要产物也是云端推理芯片。

Syntiant 的深度学习处置惩罚器

w5wVIIv42i0Pi194.jpg

互联网巨头差别的芯片计谋和举措为他们实现了最大化收益,同时也使得他们在半导体范畴的脚色开始变得多样。

他们是最大的芯片客户,有着最丰富的盘算场景和非常巨大的业务负载,每年为几家大型半导体公司和新兴芯片创业公司带来海量订单;同时,他们已经开始定制芯片或自主研发芯片,在某种水平上成为这些半导体大公司和创业公司的潜伏竞争对手,大概给他们带来产物替换风险;末了,他们照旧资源巨头,可以借助资源杠杆,通过投资和并购来美满本身的技能生态。

这些让互联网巨头、半导体巨头和芯片创业公司之间的关系玄妙且复杂,从而也让市场格局和财产发展趋势也更加不明白。

但假如我们对以上互联网巨头已有计谋、举动和效果举行分析,那就很轻易发现他们本身在市场中的定位,在肯定水平上就可以制止和他们直接竞争,同时还可以围绕着他们的需求发现更多时机。

好比,根据谷歌的举措,我们就可以判定练习芯片大概就更加得当已经有成熟练习框架和算力的巨头去做,谷歌已经证明白,通过芯片、练习框架和算力的强绑定可以得到比 GPU 更好的结果。

假如创业公司只做一个练习芯片,没有本身的练习框架,也无法与差别客户的网络拓扑布局和软件体系产生强耦合关系,那是很难与英伟达去竞争的,同时也面对谷歌的竞争。

而以推理芯片为代表的人工智能通用芯片就会存在更大时机,它是独立的,思量的是可编程性和机动性,与客户的网络及软件没有强相干性。

互联网巨头对此没有定制化开辟的需求,反而由于自身的需求及本钱收益的思量,会更倾向于战略投资这个方向的创业公司,或直接购买这类芯片。

同时,一个范畴专用的推理芯片也是可以在性价比方面凌驾 GPU 的。GPU 的应用范畴较广,包罗 Graph、人工智能和高性能盘算等,人工智能又包罗推理和练习。GPU 巨头很难去选一个细分范畴,为一个小市场去重新计划一套架构,他们依然是以一个市场向导者的脚色去关注最通用、最广泛的市场。

而创业公司完全可以选择一个最细分的方向,好比说云端推理芯片,然后专注于架构和性能提拔上,且耗费更低的本钱,从而在这个细分市场上取得乐成。返回搜狐,检察更多

责任编辑:





上一篇:办理漂移题目!任天国NS手柄新专利曝光:3DS同款CirclePad摇杆 ...
下一篇:曝新iPadPro无缘春季发布会:4月直接上架官网开售搭载MiniLED屏 ...
您需要登录后才可以回帖 登录 | 加入社区

本版积分规则

 

QQ|申请友链|小黑屋|手机版|Hlshell Inc. ( 豫ICP备16002110号-5 )

GMT+8, 2024-5-19 05:11 , Processed in 0.163162 second(s), 47 queries .

HLShell有权修改版权声明内容,如有任何爭議,HLShell將保留最終決定權!

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表