36氪首发|「芯声智能」获数千万人民币A轮融资,低功耗音频NPU芯片已落地沃达丰、3M等头部企业
作者|韦世玮
编辑|石亚琼
**
36氪获悉,近日音频NPU芯片及算法公司「芯声智能」宣布完成数千万人民币A轮融资,由光远资本独家投资,戈杨资本担任本轮独家财务顾问。该轮资金将主要用于扩充研发人员和技术支撑团队,以及芯片迭代的研发投入。
芯声智能成立于2018年9月,主要基于自主研发的可重构神经网络引擎,开发面向智能语音识别领域的AI芯片及算法,具有高性能、超低功耗、高识别率、低成本、算法扩展性强等特点,适用于智能手机、耳机、白色家电等品类。
声学赛道的覆盖面十分广泛,人们日常使用的智能手机、蓝牙耳机、智能音箱等设备,在听歌、通话、语音交互等一切和声音有关的应用背后,都需要对声音信号进行环环相扣的处理,同时也有着一条长长的元器件供应链。
例如,语音识别、语音助手、通话降噪应用主要涉及声音的前处理,与麦克风有关,设备的音质、主动降噪、音效,主要涉及声音的后处理,则与喇叭有关。
但芯声智能CEO汤健告诉36氪,他发现目前业内许多玩家设计语音芯片时,大多侧重在前处理应用的技术创新,而后处理环节仍是传统方法。因此,公司的初衷是能设计出一款同时兼顾声音前处理和后处理的语音芯片。
那么,公司为何选择从NPU(嵌入式神经网络处理器)切入?一方面,大型SoC的研发周期长、成本高,对初创公司来说落地门槛较大;另一方面,产品主要面向低功耗、锂电供电的场景,主控芯片跑算法的功耗太高,因此比较适合开发一款NPU芯片,作为协处理器与主控芯片进行配合。
目前,芯声智能的低功耗语音芯片XS200X已实现量产出货,这是一款专用的语音识别前端芯片,基于RISC-V架构,采用小型化神经网络设计,突破了超低功耗ADC、低功耗PLL系统设计、低功耗数字系统设计、小型化封装等多个难点。
具体来看,XS200X芯片拥有四大特点:一是采用超低功耗设计,支持Always on唤醒模式,唤醒功耗小于1mW;二是具有远场识别高强度计算能力,支持AGC、AEC、波速成型、去混响、复杂降噪、多命令词识别等14种算法,其中KWS唤醒率在无噪达98%以上;三是基于DNN+CNN神经网络降噪算法,能较好实现通话降噪(ENC)和主动降噪(ANC)效果;四是配置了4麦克风接口,支持多路模拟MIC输入或多路数字MIC输入,支持多通道TDM(I2S)输入和输出。
芯声智能的超低功耗语音唤醒识别芯片
基于这些特点,芯声智能的语音降噪方案能很好地解决大风噪场景下的降噪问题,这也是现在许多音频产品主要面临的难题。汤健举例,在摩托车车速为120码情况下,公司的单麦克风降噪解决方案能大幅度地过滤风噪和路噪,实现清晰通话,而业内知名厂商的蓝牙芯片方案最多只能实现30码车速的通话。
在这背后,正是芯声智能采用神经网络降噪技术,通过对大风噪、马路、地铁、广场舞等场景下的6000多种噪音进行训练,大幅度地解决了各类噪声问题。
从市场层面看,目前芯声智能主要对标美国DSP Group,后者为全球领先的通信语音和无线芯片组解决方案提供商,在音频数字信号处理器、AI内核、音频物联网无线芯片等方面有丰富技术经验。同时,该公司已于2021年8月被Synaptics公司宣布以5.28亿美元收购。
汤健谈到,芯声智能核心团队从四年前就开始基于RISC-V架构开发芯片方案,积累下不少成本控制和技术开发经验,这恰恰是公司和其他玩家相比的差异化优势。
一方面,市场上的玩家多采用Arm Cortex-M4F架构或Cadence的架构,产品开发需要支付IP专利费用,而芯声智能采用开源的RISC-V架构,所有模拟IP均为独立自主研发,能大大减少产品开发的成本;另一方面,市场上产品的同质化现象严重,而公司基于RISC-V架构开发芯片,能在实现产品差异化的同时,保证产品的功耗、算力、性能的一致性。
业务方面,芯声智能拥有出行、对讲、声纹解锁、声源定位四个业务板块,每个版块相互结合实现落地。例如,出行和对讲主要面向智能头盔市场,公司与饿了么合作为骑手开发智能头盔,让骑手可直接通过语音交互完成订单处理、打电话等工作;声源定位则主要瞄准直播、视频电话会议领域。
现阶段,公司的XS200X芯片已完成多家芯片/软件平台商的联合调优和参考设计,并在智能手机、智能耳机、智能头盔、车载音频、低延时直播、电话会议等市场均有落地,其中合作伙伴不乏沃达丰、3M、哈曼、五菱科技、饿了么等国内外头部企业。
公司与饿了么合作开发的智能头盔
成立至今,芯声智能的累计研发投入已超3000万人民币,目前有芯片销售和算法销售两种盈利模式。其中,2021年芯片出货量规模数十万颗,主要落地智能头盔、对讲机/会议音箱、耳机领域;算法则销售单麦神经网络降噪算法和双麦降噪算法,现阶段该模式仅适合恒玄科技和诺达的蓝牙芯片平台。
接下来一年,芯声智能将重点推广离线声纹识别功能,覆盖身份认证、辅助解锁等应用。同时,公司预计今年在智能头盔、对讲机领域的芯片出货量,将分别实现数百万颗出货规模。
团队方面,芯声智能的核心团队具备从芯片到算法多领域的关键技术能力和量产经历,以及丰富的技术和销售经验,平均从业经历超15年。其中,公司董事长姜黎为东京工业大学工科博士,拥有20 年以上芯片开发经验,曾任富士通半导体GM和国科微CTO兼董事,以及国家相关重大科技项目负责人,至今累计申请专利100余项,累计开发并量产芯片超20款;公司创始人、CEO汤健曾任国科微CMO,并曾在创毅视讯、中普微、天津诺思担任销售总监,拥有十余年芯片销售经历和团队、渠道管理经验。
也想拥有抖音红人般的动人歌声?有了它,你也能成为“声卡战神”
似乎是觉得小麦克并不过瘾,唱吧于本月12日发布了专门为直播设计的声卡套装产品,简洁化的设计与齐全的功能,分分钟送你登上主播宝座。
带显示屏的声卡
唱吧实际上的主推产品为K10声卡。从外观上看,声卡的设计与传统黑盒子造型有诸多不同,其中最惹人注意的便是彩色显示屏了。通过显示屏,使用者可以轻松看到声卡的参数与混响特点,而不用再去注意老设备上密密麻麻的指示灯。
K10声卡采用电脑级NUVOTON ARM9架构主芯片,协调运作的是美国cirrus logic 的 WM8569S 混响芯片,并且还有唱吧定制的 VD8863 芯片作为DSP芯片,支持24位192kHz采样率,效果可以媲美电脑声卡。
另外,为了方便主播营造气氛,K10还内置多种场景混响效果,还有不同的场景音效,并支持最大32GB TF卡进行容量扩展,可以容纳下10万种音效,直播时使用游刃有余。
声卡除了能够让声音变得亮丽,还可以对不同音色进行修饰,或是通过自带、自定义的特效制作出不一样的声音。
套装:为直播而生
套装中还包含有电容麦克风X2和直播监听耳机A2。因为价格上的妥协,麦克风与耳机与专业款产品还有不少的差距。但唱吧在这两款配件上针对K10做了大幅优化,不管是降噪,还是细腻调音,都能满足直播间的基本需求。
唱吧K10声卡带X2麦克风、A2耳机套装版售价1299元,单独购买声卡则是799元,目前已经在京东开启预售,耳机、麦克风以及模特所用的同款支架同样单独有售。
相关问答
彩神Ⅴll首页(官方)下载网站
164mm*65mm*39mm,重量约为220g,手感圆润顺滑,轻量化设计单手握持也毫无压力。唱吧巴赫麦克风规避了普通麦克风录制出来的人声略显单薄的弊...唱吧...
epcrp话筒怎么样?
epcrp活筒外观时尚便携,采用的是灵敏度极高的电容式唛头,内置可充电电池和混音芯片,弥补了手机K歌应用只能通过软件混音的先天不足。该话筒内置的专业芯片混...
10K歌宝什么牌子好?
1.MAONOK歌宝MAONOK歌宝作为一款较为新兴的KTV音频设备品牌,备受追捧。其音质表现优异,声音清晰、纯净。MAONOK歌宝最大的亮点是其内置的混响芯片,可以...
M50195P是什么电路?
M50195p是专业及民用音响设备中混响电路里的主要集成电路。m50195在做效果器、混响处理上是比较好,对于做的很好的DSP比较,也难分上下,65831不在一个档次上,...
20年前的先锋音响用什么功放芯片?
答:20年前的先锋音响用的功放芯片是民用级的混响芯片,模拟卡拉OK50195芯片。50195芯片的保真度与清晰度是目前模拟效果芯片之中最好的,但声音的丰满度不够,...
先锋300功放与先锋350功放有哪些区别-设计本有问必答
详细介绍:输出功率:100W×2国际电压110V/220V耗电:380W采用专业混响芯片,具有专业"REVERS"混响效果,卡拉OK效果极佳延时及混响深度可独立调节,主...
我有一功放主元件cd2399gp现只有嗡嗡声是为什么-ZOL问答
朋友CD2399是话筒混响芯片不是放大芯片拍个照片上来我帮你看看只有嗡嗡声一般的损坏大部分是主电源滤波电容失效前级运放损坏(型号大部分是4558NE5532L...
便宜声卡和音响有什么区别?
MP3等数字音频文件,解码转换为供扬声器发声单元发出声音的模拟信...声卡是一种实现数字信号和模拟信号相互切换的硬件,充当了将MP3等数字音频文件,解码转换为...
老铁们,我想问问!正规消除游戏定制机构,消除游戏定制什么...
[回答]游戏声卡主要是针对游戏声音效果开发的声卡.也可以兼容播放音乐.但是不能K歌.因为游戏声卡不具备混响芯片。我自己现在用的是创新(Creative)SoundBl...
ktv的音响效果是肿么调的?是真实的声音加什么效果?-ZOL问答
就算功能一样,不同的品牌,采用不同的混响芯片,不一样的线路设计,就有高低档次之分,再加上不同的空间大小,不同的音箱布局,不同的装修效果(指吸音,扩散的处理)。...