“RISC-V可重构” 中小型“玩家”的新出路?

2019-09-05 芒果云 手机版
浏览

首先,从RISC-V的角度来看,它究竟能何种程度上提升AI芯片在变幻莫测的AIoT市场形势下的适应力?谭章熹表示:“RISC-V是非常简单和非常干净的设计,用户指令和特殊指令分开,它是模块化的,可以根据需求做自己定制化的模块和扩展,有足够的指令空间做定制化。另外,它的稳定性也很好,当我们定了RISC-V本身的基准指令后,不会再有变化,要想增加新的指令,可以通过扩展子集实现,而不是加强新版本。”作为软硬件接口的指令架构,RISC-V对AI芯片提供了非常重要的基础,有非常好的标准指令子集,以及编译器、Linux支持,这样的灵活性使得自由修改AI扩展非常容易。

“RISC-V可重构” 中小型“玩家”的新出路?


也正基于此,OURS的首款AI芯片仅用7个月就完成了从零开始设计验证到交付流片的全部工作,而高通最近领投的SiFive公司,也宣称开发出一套RISC-V新的IP仅需要1-3个月的时间,相比之下ARM芯片往往需要1年甚至更久,这是非常直观的差距。对此,谭章熹解释到:“之所以能够在不到一年的时间内完成全部研发工作,一个很关键的因素就是RISC-V的指令集。我们知道,一款微处理器的设计很难,因为软件和硬件接口的地方很多,比如OS、SW framework、模拟器等,不过我们依靠RISC-V的生态,生态中的开发工具以及工具链等帮助我们极大的缩短的芯片的校验时间。”

另外,在AI算法运行的核心载体即AI加速引擎方面,据悉OURS的首款AI芯片Pygmy除了核心的CPU架构采用RISC-V指令集设计之外,内置的12个高度可编程AI加速引擎同样是基于OURS自定义开发的RISC-V矢量扩展指令集设计而成,这也为其进一步保持与跟进新算法预留了充足的可扩展空间。

谭章熹指出:“Pygmy的12个高度可编程的AI引擎,主要针对神经网络以及CNN算法进行了优化,能够支持AI图像和语音的应用。之所以集成的是12个可编程AI加速引擎,与我们芯片的面积是有很大关系的。当然12个加速引擎只代表一个边界,根据不同应用的性能和功耗要求,可以配置数量不同的可编程AI加速引擎,并且我们的团队能够在3个月内就完成AI加速引擎核的定制。”

“RISC-V可重构” 中小型“玩家”的新出路?

固然,为提升AI芯片对新算法的适应力,除了指令集上从复杂转向精简化设计之外,芯片架构上的创新也非常重要。专用加速引擎的设计上,时擎智能主要采用的是当下大火的可重构的芯片架构。这种方法类似于以一种搭积木的方式来进行架构设计,即将神经网络打散成很多个不同模块,当客户需要做语音AI时,就通过选择特定的区块来进行组合,从何实现语音AI加速功能;而当客户需要做视觉AI时,就重新将“积木”打散,根据需要来进行组合使用。这样既可以做到更强的适应性,同时又能保持小体积、低功耗以及够用的性能。

“RISC-V可重构” 中小型“玩家”的新出路?

时擎智能设计总监曹英杰表示:“AI算法的演进速度会比芯片设计的速度会快得多,目前摆在芯片架构师面前的很大挑战就是,如何要为两年以后的算法做架构设计,如果AI芯片架构做的过于的固化和专用,当芯片出来的时候,当时所支持的专用AI算法很有可能已经过时。而可重构的架构虽然可能在某些专用算法上,计算效率会比那些比较固化的设计差几个百分点,但它适用于不同AI算法的平均计算效率会高的多,通用可重构的架构在比较长的一段时间内都能适应新进来的算法。”通过这种方式,能够进一步提升AI芯片对市场应变能力,灵活适应AIoT市场变幻莫测的环境。

总之,算法演进与芯片架构之间的矛盾已在当今的AI芯片市场广泛显现。对如今越来越多的行业新秀们来说,这种矛盾也将在未来相当长一段时间内持续存在且难以根除。因此,在没有如高通、英伟达以及地平线等AI芯片大厂那般的算法实力背景下,采用RISC-V以及可重构架构来提升产品竞争力会是当下很多中小型AI芯片厂商的一条出路。但鉴于RISC-V及可重构架构现阶段都还不够成熟,这也将会抬高中小型AI芯片厂商试水的成本。但可以预见的是,未来一段时间内,高通、英伟达以及英特尔会陆续针对RISC-V以及可重构芯片展开更多的技术布局,编者认为,这些重量级AI芯片玩家的加速推进,也将快速拉低这类领域的入局门槛。不过,国际大厂的陆续跟进,也将加剧市场竞争,对于很多AI芯片产业的中小型玩家来说并不是好事。毕竟,市场份额被大厂迅速分食和挤压的形势下,“存亡”可能仅在一念之间。