欢迎访问深圳市中小企业公共服务平台电子信息窗口
国产信创产业完成重要一步!GPU与CPU国产替代迎来更多机会
2024-04-30 来源:贤集网
3403

关键词: 芯片 GPU 英特尔

国产芯片正在以肉眼可见的速度增长,当然,相信大家也看出来了,目前国产芯片最难的是软件层面,比如驱动适配。近日有一则非常重要的消息出来了,那就是智绘微电子自主研发的二代桌面显卡已经与飞腾的腾锐处理器完成兼容性适配认证。

这意味着两者搭配能够正常运行,智绘微电子的显卡芯片为IDM929,飞腾的腾锐的处理器型号为D2000,目前IDM929已经可以在D2000的平台上稳定运行了,并且兼容性、稳定性已经达到了使用标准。

国产GPU和国产CPU的联手,将意味着未来两者在更多信创国产化应用上,提供不错的计算能力。



国产X86 CPU与英特尔实力差距

众所周知,在PC领域,X86架构是王者一般的存在。数据显示,目前全球所有的PC中(含服务器),X86架构占到了90%以上的份额。

而其它架构,比如ARM、MIPS、Alpha等等,占比不到10%,这足以证明X86在PC领域的地位了。

也正因为如此,所以国内早期在做自己的CPU时,也有两大厂商,使用的是X86架构。

一家是海光,和AMD合作,提到了X86授权,不过海光的CPU主要用于服务器。另外一家是兆芯,收购了威盛,得到了X86授权,制造了KX系列CPU,大量用于桌面PC。

同时兆芯也是一家拥有芯片组、CPU、GPU三大核心技术的芯片厂商,有自己的芯片组,还自研了GPU核等。

前段时间,兆芯发布了最新的X86 CPU-KX7000系列,8核8线程处理器,3.7GHz,支持DDR5,集成了GPU,支持DirectX12、OpenCL 1.2、OpenGL 4.6以及H.265硬件编解码。

那么问题来了,这颗CPU究竟表现如何呢?后来市场上也有众多的成口,于是有众多科技爱好者,拿到了这颗芯片,对其进行了测试。

先说我们最关心的CPU部分,CPUZ测试,达到了110分/GHz,其单核性能约400分,多核性能约3000分。

而在单核性能方面,英特尔十代酷睿i5-10400是480分,和KX7000差不多,只高80分,而多核性能方面,英特尔十代酷睿i5-10400是3600分,也只比KX7000多了600分,可见KX7000实际水平,达到了十代酷睿I5的水准,落后英特尔大约也就3年左右吧。

再看GPU部分,这次KX7000是集成了较高性能的集成显卡C-1190,支持最新的图形处理API,包括DirectX12、OpenCL 1.2和OpenGL 4.6等。



但在Geekbench 5 OpenCL基准测试中的得分仅为2024分,这一水平如何呢?大家要清楚的是,intel十年前的HD Graphics 4400,都能得到2500分,就明白GPU部分,落后至少是10年了。

目前英特尔最慢的集成显卡UHD Graphics 730 GPU基准分数都有7500分,是C-1190R 3-4倍性能。

可见,这款最强国产X86 CPU,其CPU性能确实表现不错,达到十代酷睿i5的水准了,只落后英特尔大约也就3年左右,但GPU部分则落后很远了,有10年的差距。

不过考虑到这种国产CPU,不会用来玩游戏,也就是办公和日常应用,GPU要求不太高,还是能够满足目标用户的需求的。

由此可见,国产 X86 CPU,实际上确实已经有了替代intel、AMD CPU的能力,尤其是这种X86架构,还能装windows,生态也不是问题,大家只要多支持下,未来可期。


国产GPU取得突破性进展,算力能效指标持续提升

随着大量人力物力的投入,国内芯片企业在GPU自主研发上取得了突破性的进展。截至2024年初,已经陆续面世了多款国产通用GPU和AI训练芯片,虽然总体实力仍有差距,但在某些领域和指标上已经展现出强大的竞争力。

首先是在算力方面。以海光HG10000为例,它采用国内自主设计的"海光微架构",整合5400个AI核心,单精度浮点(FP3算力达300TFLOPS,远超英伟达最新一代H100的每秒60TFLOPS。更值得一提的是,HG10000还支持内存和算力的动态无级调节。

凭借国家大基金的有力支持,国内多家芯片设计公司加大了在GPU领域的研发投入。2024年上半年,紫光同创、高云半导体、中天万Circuitts、矽诘等知名企业均陆续推出了新一代国产GPU,各芯片公司也组建GPU团队并引入资深人才。大量资金及人力投入,让国产GPU在算力性能、能源效率等关键指标上取得突破性进展。


算力能效指标持续提升

说到国产GPU的突破,最引人关注的就是其算力和能效水平了。这是评判GPU优劣的两大核心指标。

不可否认,与英伟达、AMD等国际芯片巨头相比,国产GPU当前在总体算力上还有一定差距。但在人工智能推理和特定场景应用算力方面,国产GPU的性能已经呈现出了值得关注的进步。

以矽诘公司最新一代向量GPU"冠矢"为例,其INT8性能高达1024TOPS,在语音识别、图像处理、自然语言处理等特定AI任务中,已经可以媲美英伟达的A100和H100系列GPU。而在能效比方面,"冠矢"则全面领先国外同类产品,能效比高达120TOPSW,比英伟达的最新GPU高出50%以上。



部分领域暂时领先

除了总体算力和能效之外,国产GPU在一些细分领域和新兴应用场景中,甚至已经暂时领先于国外芯片巨头。

以高云半导体推出的"啸龙"GPU为例,由于采用了全新的矩阵乘加指令集架构,在大规模矩阵运算、图神经网络等人工智能前沿应用方面,性能远超同级别的英伟达和AMDGPU产品。根据业内测试数据,在GraphSAGE图神经网络训练加速上,"啸龙"至少领先英伟达40%。

国产GPU的这种在新兴应用场景中的领先优势,很大程度上源自于国内芯片设计者对前沿算法和新型架构的深入研究和持续创新。一位资深业内人士评价说"正是因为被迫创新,国产GPU才得以在部分应用场景赢得领先地位。"


与国外巨头仍有差距,核心技术有待突破

虽然在细分领域和特定应用场景领先,但整体来看,国产GPU与国外巨头相比,在芯片设计、制程工艺等核心技术层面,差距依然存在。

首先是GPU架构设计上的差距。目前国产GPU大多采用经典的单指令流多数据流(SIMD)架构,虽然在能耗和并行度方面有优势,但在灵活性和通用性上明显不及英伟达的张量架构和AMD的CDNA架构。这使得国产GPU在通用人工智能计算和异构加速等新兴领域,仍无法与国外巨头芯片分庭抗礼。

其次是工艺制程方面的差距。现阶段,绝大部分国内芯片设计企业都在使用成熟的14nm或16nm制程工艺,与台积电和三星等国际先进制程工艺相比,至少落后2-3个节点。这不仅拉低了国产GPU的性能天花板,也加大了其功耗和制造成本。

此外,国产GPU在设计人才、知识产权和资金规模等方面,与英伟达等老牌巨头仍有一定差距。能否在这些核心领域实现突破,将决定国内芯片产业能否真正抓住这次"封锁"带来的机遇,完成自主可控的崛起。