典型的FPGA芯片有哪些,看完这篇文章就知道了
目前市场上FPGA芯片主要来自Xilinx公司和Altera公司,这两家公司占据了FPGA 80%以上的市场份额,其他的FPGA厂家产品主要是针对某些特定的应用,比如,Actel公司主要生产反熔丝结构的FPGA,以满足应用条件极为苛刻的航空、航天领域产品。下面介绍Altera和Xilinx两家公司的代表产品。
Altera公司的典型产品
Altera公司的FPGA器件大致分三个系列:一是低端的Cyclone系列;二是高端的Stratix系列;三是介于二者之间可以方便ASIC化的Arriva系列。
1. 面向高性能的Stratix系列FPGAStratix系列FPGA能够帮助用户以更低的风险和更高的效能尽快推出最先进的高性能产品。结合了高密度、高性能及丰富的特性,Stratix系列FPGA能够集成更多的功能,提高系统带宽。Stratix系列产品代的特性是革命性的,而且还在不断发展。Stratix系列FPGA的推出时间和工艺技术如表1-1所示。
表1-1 Stratix系列表
Stratix FPGA和Stratix GX型号是Altera公司Stratix FPGA系列中最早的型号产品。这一高性能FPGA系列引入了DSP硬核知识产权(IP)模块及Altera应用广泛的TriMatrix片内存储器和灵活的I/O结构。
Stratix II FPGA和Stratix II GX型号引入了自适应逻辑模块(ALM)体系结构,采用高性能8输入分段式查找表(LUT)替代了4输入LUT。Altera最新的高端FPGA使用了这一创新的ALM逻辑结构,可批量提供Stratix II和Stratix II GX FPGA,还是强烈建议新设计使用它们。
Stratix III FPGA是业界功耗最低的高性能65nm FPGA。可以借助逻辑型(L)、存储器和DSP增强型(E)来综合考虑用户的设计资源要求,而不会采用资源比实际需求大得多的器件进行设计,从而节省了电路板,缩短了编译时间,降低了成本。Stratix III FPGA主要面向很多应用的高端内核系统处理设计。
Stratix IV FPGA在任何40nm FPGA中都是密度最大、性能最好、功耗最低的。Stratix IV FPGA系列提供增强型(E)和带有收发器的增强型器件(GX和GT),满足了无线和固网通信、军事、广播等众多市场和应用的需求,这一高性能40nm FPGA系列包括同类最佳的11.3 Gbps收发器。
在所有28nm FPGA中,Stratix V FPGA实现了最大带宽和最高系统集成度,非常灵活。器件系列包括兼容背板、芯片至芯片和芯片至模块功能的14.1 Gbps(GS和GX)型号,以及支持芯片至芯片和芯片至模块的28G(GT)收发器型号,具有一百多万LE,以及4 096个精度可调DSP模块。
采用了Intel 14nm三栅极技术的Altera Stratix 10 FPGA是任何FPGA中性能最好、带宽和系统集成度最高的,而且功耗非常低。Stratix 10器件具有56Gbps收发器、28Gbps背板、浮点数字信号处理(DSP)性能,支持增强IEEE 754单精度浮点,单片管芯中有四百多万逻辑单元(LE),支持多管芯3D解决方案,包括SRAM、DRAM和ASIC。Stratix 10 SoC是Intel 14nm三栅极晶体管技术的第一款高端SoC系列,具有针对每瓦最佳性能进行了优化的下一代硬核处理器系统。
2. 面向低成本的Cyclone系列FPGACyclone系列FPGA是为了满足用户对低功耗、低成本设计的需求,帮助用户更迅速地将产品推向市场。每一代Cyclone系列FPGA都致力于解决提高集成度和性能的技术挑战,降低功耗,产品及上市时间的问题,同时满足用户的低成本要求。
Cyclone系列FPGA的推出时间和工艺技术如表1-2所示。
表1-2 Cyclone系列表
Cyclone FPGA是第一款低成本FPGA。对于当今需要高级功能及极低功耗的设计来说,可以考虑密度更高的Cyclone IV和Cyclone III FPGA,这些更新的Cyclone系列将继续为用户的大批量、低成本应用提供业界最好的解决方案。
Cyclone II FPGA从根本上针对低成本进行设计,为大批量低成本应用提供用户需要的各种功能。Cyclone II FPGA以相当于ASIC的成本实现了高性能和低功耗的目标。
Cyclone III FPGA前所未有地帮助用户同时实现了低成本、高性能和最佳功耗,大大提高了竞争力。Cyclone III FPGA系列采用台积电(TSMC)的低功耗工艺技术制造,以相当于ASIC的价格实现了低功耗的目标。
Cyclone IV FPGA是市场上成本最低、功耗最低的FPGA,现在还提供收发器型号产品。Cyclone IV FPGA系列面向对成本敏感的大批量应用,以满足用户对越来越大的带宽需求,同时降低了成本。
Cyclone V FPGA为工业、无线、固网、广播和消费类应用提供市场上系统成本最低、功耗最低的FPGA解决方案,该系列集成了丰富的硬核知识产权(IP)模块,帮助用户以更低的系统总成本和更短的设计时间完成更多的工作。Cyclone V系列中的SoC FPGA实现了独特的创新技术,例如,以硬核处理器系统(HPS)为中心,采用了双核ARM CortexTM-A9 MPCoreTM处理器,以及丰富的硬件外设,从而降低了系统功耗和成本,减小了电路板面积。
Xilinx公司的典型产品
Xilinx的主流FPGA分为两大类:一种侧重低成本应用,容量中等,性能可以满足一般的逻辑设计要求,如Spartan系列;另一种侧重于高性能应用,容量大,性能能满足各类高端应用,如Virtex系列,用户可以根据实际应用要求进行选择,在性能可以满足的情况下,优先选择低成本器件。
1. 面向高性能的Virtex系列FPGA
Virtex系列是Xilinx的高端产品,也是业界的顶级产品,Xilinx公司正是凭借Virtex系列产品赢得市场,从而获得FPGA供应商领头羊的地位。可以说,Xilinx以其Virtex系列FPGA产品引领现场可编程门阵列行业。主要面向电信基础设施、汽车工业、高端消费电子等应用。目前的主流芯片包括Vitrex-2、Virtex-2 Pro、Virtex-4、Virtex-5、Virtex-6和Virtex-7等种类。
Virtex-2系列于2002年推出,其采用0.15nm工艺,1.5V的内核电压,工作时钟可高达420MHz,支持20多种I/O接口标准,具有完全的系统时钟管理功能,且内置IP核硬核技术,可以将硬IP核分配到芯片的任何地方,具有比Virtex系列更多的资源和更高的性能。
Virtex-2 Pro系列在Virtex-2的基础上,增强了嵌入式处理功能,内嵌了PowerPC405内核,还包括了先进的主动互联(Active Interconnect)技术,以解决高性能系统所面临的挑战,此外,还增加了高速串行收发器,提供了千兆以太网的解决方案。
Virtex-4系列是基于高级硅片组合模块(ASMBL)架构的,其具有逻辑密度高,时钟频率高达500 MHz;具备DCM模块、PMCD相位匹配时钟分频器、片上差分时钟网络;采用了集成FIFO控制逻辑的500MHz SmartRAM技术,每个I/O都集成了ChipSync源同步技术的1 Gbps I/O和Xtreme DSP逻辑片。设计者可以根据需求选择不同的Virtex-4子系统,面向逻辑密集的设计:Virtex-4 LX,面向高性能信号处理应用:Virtex-4 SX,面向高速串行连接和嵌入式处理应用:Virtex-4 FX。Virtex-4系列的各项指标比VirtexII均有很大程度的提高,从2005年年底开始批量生产,已取代VirtexII,VirtexII-Pro,是Xilinx在当今高端FPGA市场中的最重要的产品。
Virtex-5系列以最先进的65nm铜工艺技术为基础,采用第二代ASMBL(高级硅片组合模块)列式架构,包含五种截然不同的平台(子系列)。每种平台都包含不同的功能配比,以满足诸多高级逻辑设计的需求。除了最先进的高性能逻辑架构外,Virtex-5 FPGA还包含多种硬IP系统级模块,包括强大的36 Kb Block RAM/FIFO、第二代25x18 DSP Slice、带有内置数控阻抗的SelectIO技术、ChipSync源同步接口模块、系统监视器功能、带有集成DCM(数字时钟管理器)和锁相环(PLL)时钟发生器的增强型时钟管理模块及高级配置选项。其他基于平台的功能包括针对增强型串行连接的电源优化高速串行收发器模块、兼容PCI Express的集成端点模块、三态以太网MAC (媒体访问控制器)和高性能PowerPC 440微处理器嵌入式模块,这些功能使高级逻辑设计人员能够在其基于FPGA的系统中体现最高级别的性能。
Virtex-6系列为FPGA市场提供了最新、最高级的特性。Virtex-6 FPGA是提供软硬件组件的目标测试平台可编程硅技术基础,可帮助设计人员在开发工作启动后集中精力于创新工作。Virtex-6系列采用第三代ASMBL(高级硅片组合模块)柱式架构,包括了多个不同的子系列。本概述将介绍LXT、SXT和HXT子系列的器件。每个子系列都包含不同的特性组合,可高效满足多种高级逻辑设计需求。除了高性能逻辑结构外,Virtex-6 FPGA还包括许多内置的系统级模块。上述特性能使逻辑设计人员在FPGA系统中构建最高级的性能和功能。Virtex-6 FPGA采用了尖端的40nm铜工艺技术,为定制ASIC技术提供了一种可编程的选择方案。Virtex-6 FPGA还为满足高性能逻辑设计人员、高性能DSP设计人员和高性能嵌入式系统设计人员的需求而提供了最佳解决方案,其带来了前所未有的逻辑、DSP、连接和软微处理器功能。
Virtex-7是2011年推出的超高端FPGA产品,工艺为28nm,使客户在功能方面收放自如,既能降低成本和功耗,也能提高性能和容量,从而降低低成本和高性能系列产品的开发部署投资。此外,与Virtex-6相比,可确保将成本降低35%,且无需增量转换或工程投资,从而进一步提高了生产率。
2. 面向低成本的Spartan系列FPGA
Spartan系列适用于普通的工业、商业等领域,目前主流的芯片包括Spartan-2、Spartan-2E、Spartan-3、Spartan-3A、Spartan-3E及Spartan-6等种类。
Spartan-2在Spartan系列的基础上继承了更多的逻辑资源,为达到更高的性能,芯片密度高达20万系统门。由于采用了成熟的FPGA结构,支持流行的接口标准,具有适量的逻辑资源和片内RAM,并提供灵活的时钟处理,可以运行8位的PicoBlaze软核,主要应用于各类低端产品中。
Spartan-2E系列是基于Virtex-E架构,具有比Spartan-2更多的逻辑门、用户I/O和更高的性能。Xilinx还为其提供了包括存储器控制器、系统接口、DSP、通信及网络等IP核,并可以运行CPU软核,对DSP有一定的支持。
Spartan-3系列是基于Virtex-II FPGA架构,采用90nm技术,8层金属工艺,系统门数超过5百万,内嵌了硬核乘法器和数字时钟管理模块。从结构上看,Spartan-3将逻辑、存储器、数学运算、数字处理器处理器、I/O及系统管理资源完美地结合在一起,使之有更高层次、更广泛的应用,获得了商业上的成功,占据了较大份额的中低端市场。
Spartan-3E系列是在Spartan-3成功的基础上进一步改进的产品,提供了比Spartan-3更多的I/O端口和更低的单位成本,是Xilinx公司性价比最高的FPGA芯片。由于更好地利用了90nm技术,在单位成本上实现了更多的功能和处理带宽,是Xilinx公司新的低成本产品代表,是ASIC的有效替代品,主要面向消费电子应用,如宽带无线接入、家庭网络接入及数字电视设备等。
Spartan-3A系列在Spartan-3和Spartan-3E平台的基础上,整合了各种创新特性,帮助客户极大地削减了系统总成本。利用独特的器件DNA ID技术,实现业内首款FPGA电子序列号;提供了经济、功能强大的机制来防止发生窜改、克隆和过度设计的现象;并且具有集成式看门狗监控功能的增强型多重启动特性;支持商用flash存储器,有助于削减系统总成本。
Spartan-6系列不仅拥有业界领先的系统集成能力,同时还能具有适用于大批量应用的最低总成本;该系列由13个成员组成,可提供的密度从3 840个逻辑单元到147 443个逻辑单元不等。与上一代Spartan系列相比,该系列功耗仅为其50%,且速度更快、连接功能更丰富全面。Spartan-6系列采用成熟的45nm低功耗铜制程技术制造,实现了性价比与功耗的完美平衡,能够提供全新且更高效的双寄存器6输入查找表(LUT)逻辑和一系列丰富的内置系统级模块,其中包括18KB Block RAM、第二代DSP48A1 Slice、SDRAM存储器控制器、增强型混合模式时钟管理模块、SelectIO技术、功率优化的高速串行收发器模块、PCI Express®兼容端点模块、高级系统级电源管理模式、自动检测配置选项,以及通过AES和Device DNA保护功能实现的增强型IP安全性。
这些优异特性以前所未有的易用性为定制ASIC产品提供了低成本的可编程替代方案。Spartan-6 FPGA可为大批量逻辑设计、以消费类为导向的DSP设计及成本敏感型嵌入式应用提供最佳解决方案。Spartan-6 FPGA奠定了坚实的可编程芯片基础,适用于可提供集成软硬件组件的目标设计平台,以使设计人员在开发工作启动之初即可将精力集中到创新工作上。
AI芯片新救星?FPGA真这么神吗
智东西(公众号:zhidxcom)文 | 心缘
导语:“AI芯片”这个新鲜的概念在过去一年间逐渐走过了普及的阶段,越来越被大众所熟知。在行业走过野蛮生长,开始加速落地、加速整合的过程中,也有更多的AI芯片公司也开始走出属于自己的差异化路线。
智东西在此前AI芯片系列报道第一季之后,再次出发,进一步对AI芯片全产业链上下近百间核心企业进行差异化的深度追踪报道。此为智东西AI芯片产业系列报道第二季之一。
随着大数据发展和算力的提升,AI芯片正迎来新一轮的爆发期。
近两年来,越来越多以FPGA切入AI芯片的玩家涌现出来,包括国内AI芯片创企深鉴科技、百度XPU、微软Project Brainwave、深思考医疗影像专用AI芯片等等。
尽管ASIC在性能功耗上往往有更好的表现,不过我们发现,在一片红海的AI芯片市场中,FPGA凭借自己独特的优势占有了一席之地。甚至有媒体报道称,FPGA是AI芯片的终极未来。
这一观点是否准确我们暂且不论,但它的确在AI芯片领域引起了不少波澜,也不禁让我们想要问一句,“AI芯片新救星?FPGA真的这么神吗?”
FPGA届的肯德基跟麦当劳:赛灵思vs英特尔Altera
FPGA(Field-Programmable Gate Array)即现场可编程门阵列,其灵活性介于CPU、GPU等通用处理器和专用集成电路ASIC之间,在硬件固定的前提下,允许使用者灵活使用软件进行编程。它的开发周期比ASIC短,不过相对于批量出货ASIC,单个FPGA的成本会更高。
由于FPGA容错空间相对更大,以前FPGA常被用作ASIC芯片流片前的硬件验证方法。
目前,FPGA芯片的主要四家生产厂家都在美国:Xilinx(赛灵思)、Altera(阿尔特拉)、Lattice(莱迪思)和Microsemi(美高森美)。它们一共占了98%以上的市场份额,其中,绝大多数市场被赛灵思和Altera瓜分,赛灵思约占58%,Altera约占39%。
近三年,FPGA行业完成了多项并购。2015年6月,英特尔宣布以167亿美元收购Altera(阿尔特拉)。2016年上半年,紫光在公开市场收购莱迪思6.07%的股权,同年11月莱迪思被Canyon Bridge以13亿美元收购,但此案一直没有获得美国监管单位同意。
这些并购案并未影响到FPGA在AI芯片市场的整体格局。几乎二分天下的赛灵思和英特尔确立了相似的FPGA战略布局,均将重心放在了数据中心市场,并都致力于让FPGA编程更简单。
1、FPGA的创造者——赛灵思
说到FPGA,绝对避不开的公司就是赛灵思,因为这项芯片技术就是赛灵思开创的。从2011年起,赛灵思提出全可编程(All Programmale)理念,将FPGA技术从传统的通讯、航空、国防等领域拓展到了AI和云计算领域的应用。
去年12月,智东西曾对赛灵思全球销售和市场部亚太及日本地区高级总监周海天进行深度专访(对话赛灵思:33年老牌芯片厂如何在AI浪潮里新兴业务年增46%),周海天告诉智东西,16nm产品是赛灵思众多产品线中最受AI应用厂商欢迎的产品,其尖端技术能将更多可编程应用逻辑元件集成在芯片上,满足AI对强大计算能力的需求。
作为FPGA行业长期的霸主,赛灵思拥有超过2万家下游客户,其中亚马逊AWS、以及中国的BAT云服务巨头都是它的客户。
今年3月,赛灵思新CEO Victor Peng上任之后不久,就宣布了赛灵思在AI时代的三大战略布局:数据中心优先、加速八大主流市场发展、以及重磅推出全新一代AI芯片架构ACAP。
首款代号为“珠穆朗玛峰(Everest)”的ACAP AI芯片新品将采用台积电7nm工艺打造,今年内实现流片,2019年向客户交付发货。(首发!赛灵思推颠覆性AI芯片 正面宣战英伟达英特尔)
而在终端AI方面,赛灵思则在今年收购了国内三大AI芯片独角兽之一的深鉴科技,主攻终端人工智能。深鉴科技是国内少数以FPGA切入AI芯片、并取得不错成果的代表性玩家之一。(突发!AI芯片独角兽深鉴科技被美国赛灵思收购)
此外,赛灵思FPGA也长期深耕在车用领域,适用于处理越来越复杂的先进驾驶辅助系统(ADAS)和自动驾驶。
某AI芯片创业公司CEO透露,相较其他进入自动驾驶车市场的AI芯片公司,只有赛灵思有车规级的 FPGA,L1-L3层找不到比赛灵思性价比更高的平台, 因此赛灵思至少在5年内有较好的市场契机。
2、英特尔收购Altera
另一个FPGA行业不得不提的大事就是英特尔收购Altera。为了增强其在AI芯片领域的竞争力,2015年,英特尔以167亿美元天价收购Altera,这也是迄今为止英特尔史上最大手笔的收购。英特尔随即设立研发FPGA芯片的可编码部门(PSG)。
FPGA是英特尔的AI芯片布局之一,但英特尔最重要的AI芯片项目还是难产多年的Nervana神经网络处理器项目。
英特尔采用双管齐下的FPGA战略:一方面打造CPU-FPGA混合器件,让FPGA与处理器协同工作;另一方面基于Arria FPGA或Stratix FPGA打造可编程加速卡(PAC/programmable acceleration card)。
基于FPGA技术,英特尔已经构建了一个完善的NFV生态,覆盖软硬件厂商、系统集成商、电信运营商、OTT厂商等相关企业。
此外,英特尔还为OME厂商提供一个面向包含FPGA的英特尔至强可扩展处理器的英特尔加速堆栈,进而为客户提供完整的软硬件一体的FPGA解决方案。
英特尔在7月收购芯片公司eASIC后将其并入PSG部门,并随后透露这一收购案主要是为了满足解决客户痛点,满足FPGA客户端的降低成本和能耗需求,并提供可降低16nm、10nm、7nm制程的FPGA产品成本的规模化技术。
目前加速卡还是FPGA进入硬件领域的主要形态之一,不过英特尔已经在进行其他方向、其他形态的探索,并在积极推进和其他数据中心OEM厂商在FPGA方面的合作。
FPGA AI芯片市场的主要玩家
近两年来,FPGA在数据中心的应用日益广泛。目前,FPGA服务器已在全球七大超级云计算数据中心IBM、Facebook、微软Azure、AWS、百度云、阿里云、腾讯云得到部署。由于ASIC路线风险高,目前仅有谷歌批量部署TPU。
1、最会玩FPGA的微软AI:BrainWave项目
微软Azure与FPGA的渊源可以追溯到八年前,当时的Bing(必应)搜索引擎无论是搜索结果还是相应速度都比不过谷歌搜索。为了满足Bing的需求,2010年底,一位微软研究员提出了能在FPGA上运行Bing机器学习算法的硬件设计得到了微软的认可。
如今,FPGA在加速数据处理方面的出色表现使它在微软Bing、Azure云计算服务和Office 365中均得到部署。
今年3月26日,微软Bing官方微博宣布通过英特尔Arria FPGA和Stratix FPGA芯片打造出Project Brainwave深度学习加速平台。该平台将DNN处理单元整合入FPGA,支持微软Cognitive Toolkit、谷歌Tensorflow等流行深度学习框架的软件栈,能够执行Bing智能搜寻功能所需的大规模机器阅读理解任务。
在5月微软Build 2018大会上,微软AI芯片Brainwave开放了云端试用版,开发者现在可以接入微软Azure云,试用由Project Brainwave芯片计算平台提供的AI服务。微软称其延迟比谷歌TPU低5倍,正面对标谷歌。Project Brainwave可以看作微软基于英特尔FPGA芯片打造的低延迟AI芯片。
总的来说,微软基于FPGA打造的AI芯片是目前业内最认可的FPGA方案之一。
2、百度XPU
相比微软对英特尔FPGA的专一,百度对FPGA生产厂商的态度更为开放。从2011年起,百度已就开始将FPGA应用到搜索、图像、语音等多个核心业务,它的数据中心、云计算平台和自动驾驶项目都部署了大量的FPGA。
在去年加州Hot Chips大会上,百度发布和赛灵思合作完成的基于FPGA的256核云计算加速芯片XPU。基于FPGA加速器擅长处理计算任务的特点,XPU兼具GPU的通用性和FPGA高效率、低能耗的特点,旨在处理多样化的计算任务,对百度深度学习平台PaddlePaddle优化和加速,并实现性能和效率的平衡。
不过,在今年的百度AI开发者大会上,百度推出了首款云端ASIC AI芯片昆仑,据说就是源自百度的XPU技术。
此外,百度和英特尔已有超过十年的合作历史,近两年双方在AI领域的合作加强。
同样是在今年的百度AI开发者大会上,英特尔人工智能事业部副总裁兼人工智能架构总经理Gadi Singer透露,百度正在开发基于英特尔最新FPGA技术的异构计算平台,这项技术将灵活加速百度云上的工作负载。
3、深鉴科技
深鉴科技是国内一家年轻却履历亮眼的AI芯片公司,前年成立,去年年初估值超过10亿,今年7月18日被全球第一大FPGA厂商赛灵思收购,其科研成果也在国际AI顶级会议屡获大奖。
FPGA开发难度大、周期长(一般需要3-6个月)的高门槛曾将许多公司拒之门外,深鉴从这一痛点嗅到商机。从2016年成立以来,深鉴科技一直基于赛灵思FPGA技术平台开发机器学习解决方案。经深鉴科技优化的神经网络剪枝技术运行在赛灵思FPGA器件上,可实现更优的性能和能效。
该公司提出深度学习处理单元DPU(Deep Learning Processing Unit)系列,为不愿直接使用FPGA的厂商提供了一个带接口的黑盒子。厂商只需把自己的模型训练好,将模型和数据从接口导入,就能直接获得需要的输出。深鉴负责其中的压缩和编译,生成指令可在FPGA上运行。
▲DPU 系列:用于嵌入端的亚里士多德板(上)和用于大数据端的笛卡尔板(下)
不过在后期,深鉴科技也开始涉足ASIC AI芯片的设计与流片,曾经发布“听涛”、“观海”两款AI芯片并宣布2018年流片,不过暂时没有看到相关产品信息。
4、腾讯云、华为云、阿里云
近年来,赛灵思和英特尔在中国云服务市场可谓是动作频频,和华为云、阿里云、腾讯云等国内顶尖的云计算服务提供商分别展开合作。
去年年初,腾讯云发布国内首款高性能异构计算基础设施——FPGA云服务器,随后推出基于赛灵思VU9P FPGA卡的FX3实例和基于Intel Stratix10 FPGA卡的FI3实例。
华为云也在今年年初联合赛灵思FPGA宣布在欧洲首次推出华为云FPGA加速云服务器(FACS)平台,该平台搭载了赛灵思高性能 Virtex UltraScale+ VU9P FPGA,为用户提供高性能的FPGA加速云服务。华为云还推出FPGA加速云服务器FP1 DPDK实例和推出了FP1 OpenCL实例。
今年5月,阿里云发布新一代FPGA计算实例F3,采用其自研高性能FPGA加速卡,搭载赛灵思16nm Virtex UltraScale+器件VU9P,提供16个VU9P实力规格,首创统一FPGA SHELL架构和FPGA虚拟化支持方案,使阿里云客户能加速机器学习、数据分析、基因组学和视频处理等多种工作负载。
5、其他玩家
目前,国内能够生产FPGA的公司包括紫光国芯、智多晶和AgateLogic等。而国内深思考人工智能、瑞为智能、深维科技、高云半导体、安路科技、京微雅格等公司,都曾宣布具有基于FPGA的AI芯片开发能力。
紫光国芯是国内上市公司中唯一能够量产FPGA的厂商,其FPGA、ASIC和特种微处理器常年为军方稳定供货。该公司在2016年9月正式推出国内首款内嵌高速接口(serdes)的千万门级高性能FPGA芯片——Pango PGT180H。
深思考人工智能公司在今年3月的GTIC 2018全球AI芯片创新峰会上发布全球首款基于FPGA医疗影像专用AI芯片——M-DPU,该芯片在100秒内可以分类90000个细胞,同时具备先进医学影像算法加速核心和深度学习加速核心。
深思考CEO杨志明告诉智东西,FPGA的研发周期比ASIC快很多,适于算法还在不断演进智慧医疗影像领域。深思考的DPU不是通用DPU,而是面向特定应用领域的DPU,在AI领域的最大优势是DPU与特定领域算法的深度整合,形成面向特定场景的一站式整体解决方案。
瑞为智能是国内最早使用FPGA实现技术路径的AI芯片公司之一,该公司在2015年就做了基于FPGA的AI芯片,满足前端摄像机对高算力和低功耗的需求,并在2016年实现规模商用。其AI芯片能使摄像机的图像处理达到每秒25帧,从而提取清晰的人脸图像供云端识别分析。
除了创企外,国内研究机构如北京大学、清华大学、中国科学院等在基于FPGA的AI芯片领域都有深入研究。比如,北京大学曾联合商汤科技提出一种基于 FPGA 的快速 Winograd 算法,可大幅降低算法复杂度,改善 FPGA 上的 CNN 性能。
FPGA在AI芯片行业的发展趋势
目前FPGA在AI芯片行业呈现出几种不同的发展趋势,一个是在FPGA的基础上推出优化架构,一个是最大化程度挖掘FPGA的使用疆域,还有一个是将FPGA作为跳板,逐步转向专用定制芯片ASIC。
1、基于FPGA优化架构
基于FPGA进行优化架构的发展路线以赛灵思为代表。面对价格贵、开发难度大的问题,今年3月,赛灵思发布历时4年、投入超过10亿美元打造的新一代AI芯片架构ACAP,直接宣战英伟达、英特尔处理器,对此智东西曾做深入报道(首发!赛灵思推颠覆性AI芯片 正面宣战英伟达英特尔)。
2、长期最大化使用FPGA
微软则是长期最大化程度挖掘FPGA使用边界的典型玩家。从八年前起,微软就执着于将FPGA作为其核心AI计算平台。从使用装满FPGA的专用服务器集群,到用专用网络连接的FPGA加速卡集群,再到将共享数据中心网络的大规模FPGA云服务,微软一直在尝试FPGA部署的各种可能,寻找将FPGA优势发挥的最优路径。
3、FPGA的终点是ASIC?
目前,业内的主流观点是:随着AI算法的进一步成熟固化,AI芯片最终会走向ASIC——也就是较为固定的芯片架构。
不过,赛灵思CEO Victor Peng持有不同观点,他曾经智东西,AI算法迭代、应用创新的速度还将持续很长一段时间,甚至会维持10-20年之久,因此一款灵活、可应变的计算平台将成为创新的重中之重。
而且,未来最终并不会是一款AI芯片架构统一天下的局面,我们越来越需要能够适应众多AI应用、适应不断变化的AI算法的新型芯片架构出现。
与此同时,英特尔可编程解决方案事业部亚太区市场拓展经理刘斌也认为,,FPGA在所有市场领域里都会占有一定的市场份额,从原生市场环境而言,FPGA和ASIC都有一个竞争合作的共生环境。
“专用的ASIC其实还是非常有竞争力的,”刘斌表示,“不过FPGA是在所有的垂直市场都会有一定的份额,这种灵活性和普适性是FPGA最主要的价值。”
某AI芯片创业公司CEO告诉智东西,至少在在深度学习算法稳定前,FPGA都有其生存空间。因为很多公司都发现,刚做完传统算法硬化,过了半年,内部算法团队又把算法换了。
深思考CEO杨志明则认为,FPGA与ASIC融合是AI计算的未来。单纯的ASIC芯片无法完全替代FPGA,也不具备FPGA的灵活性。就如同ASIC到现在都无法在传统领域完全替代FPGA一样,在AI领域,FPGA与ASIC也会分而治之。智慧工业机器人、智慧通信、智慧医疗、智慧装备等领域都是除FPGA以外的其他AI芯片难以介入的应用领域。
结语:深度学习加持,FPGA前景可期
最近一年,AI芯片踏入红海,除了赛灵思、英特尔等传统芯片巨头外,国内外众多AI芯片创企也纷纷加入战场。FPGA的可编程性使软件和终端应用公司能够根据算法灵活修改解决方案,这让它在AI芯片市场愈发有存在感。
当下AI仍处于早期阶段,AI算法正从训练环节走向推理环节,这个过程需要对训练后的模型进行压缩,在基本不损失模型精度的情况下将模型压缩到原来的几十分之一。在这一阶段,AI是向着有利于FPGA发展的方向进行优化和升级的。
FPGA或许只是小众的芯片,但在AI市场上,它的普适性和灵活性都使其有适合发挥其优势的应用场景。在各类AI芯片之间没有拉开绝对差距之前,每一种技术路线都有其发挥更多价值的空间。
相关问答
DSP、MCU、CPLD、ARM、FPGA芯片的区别?
图像,声音和视频是三个不同的嵌入式需求,其中从产品上来说,图像/视频应用以arm平台居多(视频处理的华为的海思,TI的DMx系列,大部分都是arm的内核芯片),声音...
fpga和芯片的区别?
单片机,可以把程序下进去,加一些外围电路和器件,如显示器,按键输入,实现某些固定的控制功能,在现代家电、玩具里有很广泛的应用。FPGA是可以取代一些很复杂...
fpga芯片哪个国家生产?
目前FPGA芯片的主要四家生产厂家都在美国目前FPGA芯片的主要四家生产厂家都在美国
DSP、MCU、CPLD、ARM、FPGA芯片的区别?
首先,单片机是一种集成电路芯片,包含了CPU,RAM,ROM,I/O和中断系统等,类似一个小而完善的计算机主板,主要应用在一些工业控制领域;DSP,数字信号处理器,是...首...
fpga芯片厂家?
深圳紫光同创电子有限公司,FPGA芯片是基于可编程器件(PAL、GAL、CPLD)发展而来,是半定制化、可编程的集成电路。FPGA的特殊之处在于,其对底层算法架构的依赖...
射频工程师,FPGA有无中年危机?
跨领域,如芯片设计都可以拓展,因为FPGA作为芯片前端验证,是非常重要的工作,一技在身,即使在一个公司出现职业危机,也不影响自己,能很快找到合适的高薪工...FPGA...
如何实现基于FPGA芯片的远程编程?
首先,对照外部芯片的电气特性部分,确认电平连接方式,在FPGA的管脚约束满足外部芯片的电气要求即可。其次,在FPGA设计中满足外部器件的时序要求,这包括两部...
为什么FPGA芯片一断电就丢失数据?
你好,首先你要了解fpga的程序下载方式,一般有3中,ASD(主动式),psd(被动式),和JTAG,一般在程序调试的过程中用的是JTAG模式,不需要片外配置芯片,他是直...你...
fpga开发板是芯片吗?
fbga开发板是把芯片的脚位全部连出来,供开发者使用。fbga开发板是把芯片的脚位全部连出来,供开发者使用。
fpga芯片上市公司排名?
1)紫光国芯——长江存储3DNAND;FPGA;2)中兴通讯——中兴微电子;3)国民技术——射频芯片;移动支付限域通信RCC技术;4)景嘉微——军用GPU(JM54...12)....