不吹不黑,国产AI芯片,和英伟达的差距,到底有多大?
最近又有消息称,某互联网大厂,计划大规模采用国产AI芯片,而放弃英伟达的芯片。
当然,对于这样的消息,大家肯定也不会太过于惊讶,这是多重原因造成的,英伟达的禁售,美国的卡脖子,中国AI芯片的崛起等等原因交集在一起,必然会有国产替代。
不过,在这好消息的背后,我们还是有必要,了解一下目前国产AI芯片和英伟达的差距,知己知彼嘛。
先说说英伟达的AI芯片水平,下图是英伟达主流AI芯片的参数情况,从A100,到H100,H200,GH200、B100、B200、GB200等。
可以看到,A100是最差的,但表现已经非常俗了,FP16算力高达312T,NVLINK带宽高达600GB/S,功率是400W,至于GB200,则是最强的,FP16算力达到5P,NVLINK带宽是3.6TB/S,功率是2700W。
接着直接上图,对比国产的一些在售的,主流的AI芯片参数,其主要参数指标,来自于网上,不一定完全准确,但应该差不太多。
可以看到,几乎所有的国产AI芯片,都不如英伟达最差的A100这颗芯片,更不要拿H100、H200、B100、B200、GB200这些来对比了。
所以说,不吹不黑,单说性能等,国产AI芯片,远远不是英伟达的对手,英伟达拿出最差的A100出来,都能将大家打趴下。
另外,英伟达在生态方面,还有CUDA,目前全球90%的AI模型,都是基于CUDA训练出来的,可见,如果从硬件性能、生态环境来看,国产AI芯片,完全和英伟达没有可比性。
这个就是当前客观存在的差距,也是事实,谁也无法回避。
不过,对于AI芯片而言,大家还要注意另外一个问题,那就是是可以集群的,一张芯片不行,我用两张,用三张,用10张,100张。
那么多卡集群之后,差距就会缩小,就看成本投入多大,决心有多高,这个也是为何国内厂商们,明明看到国产AI芯片,单卡性能不行,还会支持的原因,因为我可以多买一些啊。
毕竟英伟达的芯片再强,买不到又能怎么样呢?
由此可见,虽然目前国产AI芯片,和英伟达的差距明显,但未来随着国产厂商们的支持,市场越来越大之后,国产AI芯片崛起是必然的。
这也是为何英伟达一再表示,如果美国不准英伟达的AI芯片卖给中国,未来美国厂商将永久失去这一市场的原因。
一旦中国AI芯片崛起,生态也慢慢完善后,谁还买英伟达?
DeepMind推出芯片领域AlphaGo,几小时搞定设计,已被联发科采用
一直以来,计算机芯片是驱动 AI 发展的重要基础。现在,AI 也能够加速和优化芯片的设计了。
近日,谷歌 DeepMind 公布了一项名为 AlphaChip 的强化学习方法,可以大幅加速和优化芯片布局设计过程。而且,已被谷歌、联发科等公司采用,该方法的实用性得到了广泛验证。
DeepMind 在博客中写道:“AlphaChip 是首批用于解决实际工程问题的强化学习方法之一。
它可以在数小时内生成超越人类设计或同等水平的芯片布局,而无需耗费数周或数月的人力,其布局已应用于数据中心、手机等产品中的芯片。”
实际上,DeepMind 早在 2020 和 2021 年就分别发布了相关的论文,介绍了这种强化学习方法。
此次公布的是一篇 Nature 论文附录,揭示了更详细的技术细节,以及该方法在过去几年对芯片设计领域的积极影响。
图 | 谷歌数据中心内的 Cloud TPU v5p AI 加速器超级计算机(来源:DeepMind)
设计芯片布局并非易事。
计算机芯片的结构复杂,它由很多互相连接的功能模块组成,这其中又包含了多层电路元件。而且,这些组件之间还通过极其精细的导线相互连接。
此外,还必须同时满足很多复杂且相互交织的设计限制。
从 AlphaChip 的工作原理来看,其与谷歌的 AI 系统 AlphaGo 与 AlphaZero 等类似。
它将芯片布局设计视为一种游戏,从空白的网格开始,逐一放置电路元件,直至完成所有元件的布局。
遵循强化学习的理念,这个系统将基于最终布局的质量得到奖励。
AlphaChip 通过一种新颖的“基于边缘”的图神经网络,学习互连芯片组件之间的关系。并且,在不同芯片上进行泛化,使其设计能力随着每次布局而不断提升。
AlphaChip 在效率和性能上的表现,均优于传统芯片设计方法。
一般来说,设计一个复杂芯片(如图形处理器)的布局需要耗时约 24 个月,而较简单的芯片也需要数月时间,这意味着巨大的人力和资金成本。
相比之下,AlphaChip 能在几小时内完成芯片布局设计,并且其设计在功耗和性能方面往往优于人工设计。
自 2020 年起,谷歌开始在其张量处理单元(TPU,Tensor Processing Unit)芯片设计中应用 AlphaChip 技术。
TPU 是谷歌专为 AI 加速而设计的定制芯片,为多个生成式 AI 系统提供支持,包括:Gemini 大型语言模型、Imagen 图像生成器和 Veo 视频生成器等。
AlphaChip 在每一代 TPU 的设计中都发挥了重要作用,包括最新的第六代 Trillium 芯片,并不断提高芯片性能并加快设计周期。
图 | AlphaChip 设计的芯片块在三代谷歌 TPU 中的数量(来源:DeepMind)
据 DeepMind 介绍,为了设计 TPU 布局,AlphaChip 首先在前几代的芯片块上进行预训练。例如,片上和芯片间网络块、内存控制器和数据传输缓冲区。
之后,他们会在当前的 TPU 块上运行 AlphaChip,尝试生成高质量的布局。
与以往方法不同之处在于,AlphaChip 在完成芯片布局任务时,会随着任务增多而变得更好和更快。
除了设计专用 AI 加速器外,AlphaChip 还被用于设计谷歌 Axion 处理器(基于 ARM 架构的通用数据中心中央处理器)等其他类型的芯片。
并且,其他公司也开始采用和改进 AlphaChip 技术。
例如,芯片设计公司联发科对 AlphaChip 的应用进行扩展,用于加速开发其最先进的芯片,包括用于三星手机的 Dimensity 旗舰 5G 芯片。它还同时改善了芯片的功耗、性能和面积。
图 | AlphaChip 在三代谷歌 TPU 中平均减少的线长(来源:DeepMind)
AlphaChip 引发了基于 AI 在芯片设计领域的研究热潮。研究人员正在探索将这一技术扩展到芯片设计的其他关键阶段,如逻辑综合、Macro 选择和时序优化等。
目前,虽然新思(Synopsys)和楷登电子(Cadence)等公司已经提供了一些 AI 辅助芯片设计工具,但这些工具通常价格昂贵。
谷歌希望通过开源 AlphaChip,来普及 AI 辅助芯片设计方法。
尽管 AlphaChip 展现出了巨大的潜力,但值得注意的是,目前谷歌和联发科等公司仍然只在有限的芯片模块中使用 AlphaChip,大部分设计工作仍由人类开发者完成。
但不可忽视的是,AlphaChip 的学习速度远远超过人类专家,这意味着,它的表现将随着时间的推移而迅速提升。
展望未来,谷歌相信“AlphaChip 有潜力优化芯片设计周期的每个阶段,从计算机架构到制造的各个环节”。
这可能会彻底改变定制硬件的芯片设计,包括智能手机、医疗设备、农业传感器等日常设备中的芯片。
这一技术的广泛应用可能会对整个科技行业产生深远影响,推动从消费电子到大规模计算基础设施等各个领域的进步。
参考资料:
https://deepmind.google/discover/blog/how-alphachip-transformed-computer-chip-design/
https://www.tomshardware.com/tech-industry/google-unveils-alphachip-ai-assisted-chip-design-technology-chip-layout-as-a-game-for-a-computer
运营/排版:何晨龙
相关问答
visa和mastercard有芯片吗?-其他问题知识问答-我爱卡
[回答]不一定。visa和MasterCard目前发行的银行卡既有磁条卡也有芯片卡。因为磁条卡容易被物理复制,产生盗刷,所以渐渐被芯片卡所取代。当前发行的芯片卡...
芯片和集成电路有什么区别?
芯片是半导体元器件产品的总称,它是集成电路(IC)的载体。而集成电路是一种小型元器件,集成电路的范围要广得多。即使将一些电阻、电容和二极管集成在一起,这...
国产芯片第一龙头股是什么股?-股票知识问答-我爱卡
[回答]国产芯片第一龙头股有:1、兆易创新(603986)。国产芯片存储龙头股票,作为国产芯片行业中的龙头,兆易创新位列全球市场的前三位,随着美日公司的退出,...
据说大型芯片有几十亿个晶体管,一个都容不得出错,但为何芯片可靠性还这么高?
硅片越纯,杂质的干扰就越小。一般的半导体器件,比如你家老式收音机里用的三极管之类,就要求99.9999%以上的高纯硅(6个9);而大规模集成电路需要至少99.9999...说...
芯片、半导体、集成电路的区别是什么?
芯片是半导体元件产品的统称;是集成电路的载体。半导体,指常温下导电性能介于导体和绝缘体之间的材料。集成电路是采用一定的工艺,把一个电路中所需的晶体管...
全世界除了美国,还有哪些国家有自己的芯片?你如何评价?
许多国家都有自己的芯片,只是芯片功能的强弱和芯片产业的完整程度自己自主开发能力的强弱。目前我国的芯片要解决的问题是产业的完整程度、开发能力以及自主知...
摩尔定律将到极限,硅基芯片还有前景吗?碳基芯片会有可能吗?
摩尔定律接近极限,硅基芯片制造同样遇到天花板,碳基半导体芯片即将代替硅晶半导体突破新的高度。硅基半导技术是美国掌握并领先,在的硅基半导体技术,难于摆脱...
有人说芯片1纳米就是极限了,以后该朝哪个方向发展,光刻机还有用没有?
芯片制造的光刻机上被人卡脖子,应发动科学家,象当年研究原子弹的精神来研究制造光刻机,用10年或5年、甚至一两年就把光刻机搞成,这叫...是不是被人卡了,断供了,...
上海、深圳、武汉、无锡、杭州、长沙,谁会是“芯片第一城”?
个人觉得上海作为中国第一芯片城市的地位是不可动摇的——先发优势、完善的产业链匹配和政府效率都赋予了上海发展芯片的巨大竞争优势。集成电路作为最微小的国...
苹果芯片被寒武纪碾压,寒武纪芯片的厉害之处在哪?
11月6日,中国芯片独角兽公司寒武纪一口气发布了三款全新的智能处理器IP产品,运算能力持续突破。其创始人陈天石表示,它的目标是3年后,要在全球高性能智能芯...