4月29日,在“创芯·生生不息——进迭时空2024年度产品发布会”上,进迭时空创始人、CEO陈志坚博士发布了全球首颗 8核 RISC-V AI CPU——SpacemiT Key Stone™ K1(简称K1),用一项项实测数据证明:在满足AI算法模型快速迭代和部署方面,同等微架构的RISC-V芯片至少领先ARM芯片1.5代。
陈志坚在发布会上介绍,现有的主流AI算法部署通常使用抽象描述的多框架算法模型,落地应用至具体的芯片平台,依托CPU、GPU、NPU等相关载体。在目前的边缘和端侧计算生态中,由于各家芯片公司缺少基于CPU核定制AI算力的能力或者授权,而且NPU相较于传统CPU有一定的功耗优势,使得在实际落地场景中,NPU的使用率很高。但是NPU有其致命的缺点,各家NPU都拥有独特的软件栈,其生态相对封闭,缺乏与其他平台的互操作性,导致资源难以共享和整合。对于用户而言,NPU内部机制不透明,使得基于NPU的二次开发,如部署私有的创新算子,往往需要牵涉到芯片厂商,IP厂商和软件栈维护方,研发难度较大。
着眼于这些实际的需求和问题,进迭时空推出的K1芯片在设计和生态上采取了开放策略。以通用CPU为基础,结合少量DSA定制(符合RISC-V IME扩展框架)和大量微架构创新,以通用CPU的包容性最大程度的复用开源生态的成果,在兼容开源生态的前提下,提供TOPS级别的AI算力,加速边缘AI应用。这意味着K1芯片可以避免低质量的重复开发,并充分利用开源资源的丰富性和灵活性,以较小的投入快速部署。
RISC-V如何适用于AI应用?
进入2023年,AI让芯片的算力得到无与伦比的表现。随着AI算法对硬件算力的渴求到达前所未有的高度,传统的芯片架构正面临着前所未有的挑战。因此,实施专用架构、针对AI算法进行特定优化的芯片设计,已成为满足高算力需求的新趋势。
指令集简单便于扩展、成本低
ARM与X86,作为老牌指令集,它们内部历史遗留指令太多,后续工程师很难再对现有指令进行更新或添加。很多读者或许下载过ARM官方的文档介绍,几千页读下来,熟练掌握尚且困难,推陈出新更是难办。多指令模式更为ARM架构设计增添了复杂性。因此,在指令集的扩展方面,更富活力的RISC-V天然具有极大优势,毕竟开源、精简是RISC-V的一大特长。
与此同时,开源也带来了另一个重要的好处,那就是降低了RISC-V的技术门槛和成本。任何人都可以获取RISC-V的源代码,根据自己的需求进行定制和优化,而无需支付高额的授权费用。
契合边缘AI
RISC-V并不是适合所有的AI模型。很明显,在AI大模型方面,由于其需要的极高算力与超高的相关资源消耗,让几乎所有RISC指令集望而却步。以ChatGPT这类大模型为例,据OpenAI测算,ChatGPT训练阶段总算力消耗约为3640 PF-days(约1PFLOP/s效率跑3640天),GPT-3训练成本预计能达到500万美元/次。边缘AI无法承载大模型对算力的高需求,瞄准单一领域、对算力要求相对低的小模型AI则可以施展拳脚,RISC-V的机会就来了。尤其是物联网领域,RISC-V已经展现出了优势。
与AI算法相匹配
从算法角度来说,更高自由度的RISC-V指令集恰好与需要更快速迭代与高算力的AI算法相匹配。众所周知,RISC-V具有高度的可扩展性和模块化特点,这也意味着设计者可以根据具体的应用需求进行裁剪和定制,因此可以更好地适应不同的AI算法,包括深度学习、神经网络等。
大厂的押注与布局
在技术创新和市场需求的双轮驱动下,RISC-V发展潜力尽显。在此趋势下,各大芯片巨头纷纷投身其中,共同探索RISC-V的广阔前景,以期在未来的竞争中占据有利地位。这其中包括苹果、英特尔、高通、瑞萨、英飞凌、恩智浦、博世等。
究其原因,各大芯片厂商之所以纷纷押注RISC-V领域,背后究竟隐藏着怎样的考量与布局?
对于任何一个芯片大厂而言,在ISA的选择上都是相当谨慎的。ISA不仅决定了芯片开发的难易程度,也决定了与之绑定的软件和开发生态,甚至可能会影响到市场面临的竞争。
当前,移动芯片市场的性能之争愈演愈烈,不论高通、英伟达,还是三星、苹果,实际上它们都是基于Arm架构开发的,都属于Arm联盟的成员之一。目前为止,Arm已经占据了智能手机芯片领域95%以上的市场份额,包括平板电脑等。
过于依赖软银集团旗下Arm公司的技术可能会给自身带来一些风险,2022年底Arm就曾因知识产权问题起诉过高通。
此外,Arm技术不仅在智能手机中无处不在,当下正迅速扩展到大型设备、数据中心和汽车用途。
汽车业务也是高通的核心业务之一,尤其是智能座舱系统。如今包括英特尔在内的其它大型半导体芯片制造商也表示,他们未来将支持RISC-V芯片的开发。这可能会给高通带来更多动力。在2022的RISC-V全球峰会上,高通高管宣布,早在2019年发布的骁龙865 SoC中,高通就已经将RISC-V用到了微控制器的设计中,并已经出货了上亿个RISC-V核心。
瑞萨作为MCU大厂之一,尤其是在汽车领域,经过多年的积累与开发,旗下已经有了多条MCU产品线。在32位MCU上,有基于自研CISC内核的RX系列,也有基于Arm Cortex-M架构的RA系列。即便如此,瑞萨还是决心开拓第三条产品线,而这条产品线正是基于RISC-V架构。
英特尔对推进RISC-V也颇有兴趣,2022年英特尔大力扶植RISC-V——以Premier(高级会员)的身份,加入了RISC-V International基金会。与此同时,它还设立了10亿美元 (约合人民币64亿)的IFS基金,用于扶持初创和成熟企业进行代工生态的创新,其中很大一部分用于RISC-V。
IFS 计划提供一系列经过验证的 RISC-V IP 内核,并针对不同的细分市场进行了性能优化,确保 RISC-V 在 IFS 芯片上跨所有类型的内核(从嵌入式到高性能)运行最佳。同时将提供三种类型的 RISC-V 产品:基于 IFS 技术制造的合作伙伴产品;RISC-V 内核被许可为差异化 IP;利用先进的封装和高速芯片间接口,提供基于 RISC-V 的小芯片构建块。
其实,英特尔在很早之前就在RISC-V路线上有所动作,2021年英特尔就推出了基于RISC-V架构的Nios V处理器。在此之前,英特尔还欲花费20亿美元收购RISC-V芯片设计公司SiFive,但最终并没有成功,不过这也让大众看到了英特尔面对 RISC-V 的心态。
RISC-V CEO Calista Redmond 表示:“RISC-V 的开放合作已经引发了半导体行业的深刻转变,这种合作伙伴关系将加速开放计算的创新。”
英特尔研究院副总裁、英特尔中国研究院院长宋继强表示,英特尔中国研究院专门把RISC-V这个开放开源的指令集列入研究领域,是因为中国在这一领域的影响力比较明显,在RISC-V国际基金会高级会员里,接近一半是中国企业或者学校。另外,中国还有政府方面的引导,想让RISC-V成为未来自主创新的重点。因此,中国未来在RISC-V发展上一定会走的很好。
前景与弱势并存 RISC-V发展顺应市场
去年,RVI在谈到RISC-V内核的增长方面时引用了一项研究,该报告预测到2025年RISC-V内核的销量将达到600亿个,而另一项研究则预测RISC-V的复合年增长率(CAGR)到2027年将达到35%。在这样一个成熟的行业中,35%的复合年增长率是非常激进和快速的,但越来越多的公司正在寻求设计自己的芯片,这有助于推动RISC-V的增长。
但RISC-V并非毫无缺点。因其轻量型的指令集,RISC-V的适用场景包括低端智能手机、个人电脑、游戏机和服务器等领域。此外,仅仅基于RISC-V芯片的研发还不足以说明它的成功。对于从未进入这两个市场的RISC-V CPU来说,即便是突破了硬件上的高性能门槛限制、达到了产品对于处理器性能的要求,但是还有很多软件生态方面的难题需要解决。RISC-V缺生态系统,但RVI不对此做任何定义,生态系统的搭建全由使用者发挥。或许,唯有RISC-V CPU的大规模量产,开发者随处可得,RISC-V生态才将爆发