欢迎访问深圳市中小企业公共服务平台电子信息窗口
龙芯中科财报下滑严重,但第二代GPU今年将交付流片
2024-03-15 来源:贤集网
3591

关键词: 龙芯 人工智能 集成电路

龙芯中科发布2023年度业绩快报,根据公司财务部门初步测算,预计2023年全年实现营收5.08亿元,同比下滑31.18%;亏损3.29亿元,同比下滑736.35%。

龙芯中科在公告中表示,去年巨额亏损系公司受宏观经济环境及半导体行业周期变化等因素的影响,叠加公司传统工控领域因客户内部管理事宜导致采购暂时停滞、电子政务市场处于调整期尚未放量,以及外部竞争不断加剧的严峻形势所致。

目前,龙芯中科基于信息系统和工控系统两条主线开展产业生态建设,面向网络安全、办公与业务信息化、工控及物联网等领域与合作伙伴保持全面的市场合作,系列产品在电子政务、能源、交通、金融、电信、教育等行业领域已获得广泛应用。


龙芯2K3000计划上半年交付流片

近日,龙芯中科在投资者互动平台回应用户提问时表示,龙芯第二代GPU核LG200将在2K3000中应用,2K3000计划在今年上半年交付流片。

LG200支持图形加速、科学计算加速、AI加速,其中图形渲染支持OpenGL 4.0,通用计算支持OpenCL 3.0,AI加速支持INT8张量计算加速部件。

在此基础上,后续将基于2K3000的GPGPU技术及3C6000的龙链技术,研制专用GPGPU芯片。

目前LG200已完成结构设计和前期的物理设计评估,配套的驱动程序原型也已就绪,正在展开全面验证。

值得一提的是,去年龙芯中科正式发布了纯自研国产CPU龙芯3A6000,采用龙芯自主指令系统龙架构,是我国本土研发、自主可控的新一代通用处理器。

性能方面,该处理器主频达到2.5GHz,集成4个最新研发的高性能LA664处理器核,支持同时多线程技术(SMT2),全芯片共8个逻辑核,对比对比Intel-i3 10100性能基本持平。


龙芯CPU从零开始的追逐

从1971年到2001年,这30年间是集成电路和CPU技术高速发展的阶段,CPU的集成度和运算速度呈指数级增长,平均18个月翻一番,30年间CPU性能提高了百万倍。不过因为CPU性能越来越高,所以性能翻倍的时间间隔也越来越长。从2001年到2010年这10年,Intel CPU的单核性能上涨了十多倍,但从2011年至2020年这10年,同级别Intel CPU的单核性能只翻了一倍。然而,Intel在这20年之所以能保持着单核性能近乎线性增长,说明它其实是游刃有余的。果然,在AMD给予Intel“惊吓”之后,Intel第12代酷睿的性能突飞猛进。虽然从第12代酷睿到酷睿14代,Intel又恢复了以往的节奏,但谁也不知道它是否留有余力。

2001年国内的CPU设计技术已经与世界脱节20~30年,龙芯CPU在这一年才开始孕育,准备挑战已经成长了30年的x86 CPU产品。

由于科技水平的整体提升,龙芯不需要从Intel 4004的水平做起,但第一款龙芯CPU——龙芯一号的性能极低,只与Pentium(586)同级别,这些古老的CPU甚至运行不了SPEC_CPU_2006。龙芯一号的性能不到同年Intel Pentium4的1/20,假如用SPEC_CPU_2006对它进行测试,按比例算成绩就只有0.2分左右。因此,纵然开始几年龙芯CPU性能每年都翻倍,但增长的绝对性能却不到Intel的零头。测试成绩从0.2翻倍到0.4,再翻倍到0.8……还要再翻两次才能抵消Intel每年上涨的两三分。如此推断,在接下来的十来年里,龙芯与Intel的绝对性能差距会越来越远,这令最有信心的人也逐渐迷茫。

2006年之后,因为某些原因,所有与“芯”有关的项目都备受质疑,在各种压力下,龙芯项目组开始急于求成。单核性能不足那就做多核,提升通用处理性能太难那就去提升专用性能,于是接连诞生几款看似强大的产品:4核的龙芯3A1000、浮点运算速度达到192GFlops的8核龙芯3B1500。龙芯3B1500的浮点性能甚至超过了Inte酷睿i7-980E,可是绝大多数应用软件需要的是单核通用处理性能,再强大的浮点性能也无法让各种软件都流畅运行。从2006年到2015年的10年间,龙芯CPU的单核通用处理性能提升缓慢,哪怕是特定行业的客户也视如敝屣,龙芯的发展境况雪上加霜。

2011年龙芯重整旗鼓,确立了桌面CPU的研究重心——提高CPU单核通用性能,并决定在每GHz的性能达到主流水平之前,最多只做4核CPU,放弃当时的众核路线。因为资金不足,龙芯开始“减员增效”,又分散了大量的精力设计能赚钱的嵌入式CPU,以维持桌面CPU的研发,新核心的研发进度被拖慢。龙芯3A2000仿真测试完成后还要等着筹集流片的钱,直到2015年才正式降生。在间断等待期间,龙芯的研发者也没有闲着,比如同步多线程、二进制翻译、动态调压调频等都诞生于这个阶段,只是要经济状况好转、技术条件成熟之后才能把科研成果变成商用产品。

龙芯3A2000改用国内40nm工艺,主频从龙芯3B1500的1.5GHz降回1.0GHz。但因为每GHz的性能提高到了2.5倍,所以单核性能达到Intel Pentium 4的水平。4核的龙芯3A2000整体性能是Pentium 4的3倍以上,应对普通的办公已经没有问题。

龙芯3A2000帮助龙芯实现了扭亏为盈,2017年发布的龙芯3A3000则是更换工艺提高频率的版本,龙芯已经启用了Tick-tock的策略:一代升级工艺,一代升级核心。2019年发布的龙芯3A4000使用了新设计的核心,每GHz的性能接近AMD的Zen核心。龙芯3A4000成为龙芯与Intel性能差距的转折点,它们的距离不再是越来越远。接下来,龙芯3A5000升级工艺,龙芯3A6000再次升级核心,通过提升单核心性能,低频打高频,一举把与Intel的差距缩短到了3年。从龙芯CPU的进步趋势,我们看到了龙芯追赶Intel产品性能的希望。


国产CPU正迎头赶上

中国是全球最大的芯片消耗国,在最近几年需求迫切以及供应环境动荡等背景的推动下,中国正涌现不少优秀的CPU处理器芯片后备军,包括龙芯、兆芯、华为鲲鹏、海光、飞腾和申威。

其中,华为鲲鹏是华为计算产业的主力芯片之一,包括服务器和PC处理器。它基于ARM V8架构,处理器核、微架构和芯片均由华为自主研发设计。

飞腾也是以ARM指令集为基础自研内核构架。目前其已形成了完善的CPU产品线,在党政信创市场占有很大优势,主要应用场景有桌面和服务器等。

兆芯和海光则分别采用X86架构。海光使用的是AMD授权的X86架构,此后海光基于永久授权的x86架构不断进行自我研发,迭代升级,主攻服务器芯片。

兆芯使用的是英特尔授权的X86架构,个人PC和服务器都有涉及。架构来源的不同给海光和兆芯这两家的应用导向也带来了一定影响,比如:海光未获得桌面产品授权,而兆芯可以做到安装Windows。

龙芯中科是目前中国CPU企业中自主程度最高的企业之一,现已构建了面向嵌入式专门应用的龙芯1号、面向工控和终端类应用的龙芯2号、面向桌面/服务器类应用的龙芯3号系列处理器及配套桥片的完整产品矩阵。根据龙芯2022年底透露的消息,该公司的竞争优势目前还是在工控业务领域。与此同时,龙芯也在布局服务器CPU。

申威则主要用于超级计算机。目前在神威、太湖之光中使用的就是SW26010芯片。

在中国服务器市场,国产CPU厂商占据的份额逐步扩大。IDC报告显示,2022年国产服务器领域,海光信息以一己之力占据行业半壁江山,并超出第二名13.7%的市场份额。根据海光信息发布的三季度财报显示,海光信息前三季度净利同比高增38%。以下是具体营收:2023年前三季度营收约39.43亿元,同比增加3.22%;归母净利润约9.02亿元,同比增加38.27%。其中,第三季度营收13.33亿元,同比增长3.3%,第三季度归母净利润2.24亿元,同比上涨27.23%。

接下来,随着信创项目的大面积铺开,信创产业也随之出现了一个现象级的风口,将创造一个万亿元级别的市场,也将极大地带动国内CPU厂商的快速发展。彼时龙芯、海光、鲲鹏等国产CPU厂商将带给市场怎样的惊喜,我们拭目以待。