首页 >资讯 > > 正文

国产替代狂奔,中国版英伟达何时现身?

维科号 2023-07-11 16:06:26

在国产GPU突围的道路上,部分厂商已经走出了自己的路。但鉴于硬件、生态等各方面的差距,这样必定是一条充满荆棘的长路。

最近,风头正盛的英伟达在算力领域又下一城。

在最新的最新MLPerf训练基准测试中,英伟达的H100仅用11分钟就训练完了GPT-3。


【资料图】

并且还在所有的八项测试中都创下了新纪录。

可以说,这是一款专为AI、HPC和数据分析而设计的“性能怪兽”。

凭借着4nm制程、800亿个晶体管、18432个CUDA核心,以及专用的Transformer引擎,H100将大模型训练速度提高了6倍。

同时,H100还支持NVLink Switch系统,可以实现单节点内和节点间的全方位GPU通信,从而支持百亿亿级(Exascale)的工作负载。

这也是其能在MLPerf 8项基准测试中横扫其他竞争者的重要原因。

在算力愈发重要的AIGC时代,任何能提高模型训练、机器学习的硬件技术,都成了各大AI企业垂涎欲滴的产物。

然而,目前在GPU领域,大部分国内企业,仍然只能仰赖英伟达一家的技术。

在国内算力愈发捉襟见肘,以及国际风云变幻的敏感时刻,国内的GPU厂商,能否奋力追赶,解决这一“卡脖子”难题,以至于成为下一个“英伟达”呢?

01 种子选手的秘密

在目前国内一票GPU的“种子选手”中,一家名叫壁仞科技的企业引起了人们的注意。

原因很简单,那就是其产品BR100不仅创下了全球算力纪录,并且宣称其峰值算力达到了英伟达A100的3倍,甚至还能对标没发售的H100。

然而,稍微了解过国内芯片行业的人都知道,在芯片领域,国内的炒作太多了,徒有其表的例子也太多了。

那么,做出这个“媲美英伟达”GPU的企业,究竟是什么来头?其自主研发的BR100,是否真的像其宣传的那样出色?

要回答这个问题,我们不妨先看看壁仞科技的创始班底,技术背景究竟如何。

作为一家通用智能芯片设计研发商的壁仞科技,成立于2019年,团队由国内外芯片和云计算领域的专家和研发人员组成。

其创始人张旭博士,不仅拥有清华大学和斯坦福大学的博士学位,还曾是英伟达的高级架构师,负责Volta架构的设计和开发。

除此之外, 团队其他成员的技术身份,也颇为亮眼。

李新荣,联席CEO,曾任AMD全球副总裁、中国研发中心总经理,负责AMD大中华区的研发建设和管理工作。

洪洲,CTO,曾在NVIDIA、S3、华为等工作操刀GPU工程项目,拥有超过30年的GPU领域经验。

焦国方,软件生态环境主要负责人,曾在高通领导和产品研发了5代Adreno移动GPU系统架构。

这样的团队背景,决定了壁仞科技的技术底色。

依据之前在英伟达、AMD、高通、商汤科技等知名企业的研发经验和技术积累,壁仞科技研发了自主原创的芯片架构——壁立仞。

壁立仞架构基于SIMT(单指令多线程)模型,针对AI场景进行了专用的优化和定制。

其最大的特点,就是可以将多个小芯片拼成一个大芯片,每个小芯片只做一部分功能,然后通过高速互连组合成一个大芯片。

这样可以提高芯片的良率和可靠性,同时降低成本和功耗,实现更强大的算力和扩展性。

这就是壁仞科技所谓的Chiplet的设计理念。

这种技术的难点在于如何保证芯片之间的高速通信和协作,同时避免信号干扰和功耗过高。

因此,如何设计合适的芯片分割和组合方案,使得每个芯片都能发挥最大的效能,同时减少电磁干扰和热耗散,就成了Chiplet能否成功的关键。

对此,壁仞科技使用了两种关键的技术2.5D CoWoS和BLink,来攻克这一难关。

简单地说,2.5D CoWoS技术是一种把多个芯片堆叠在一起的技术,它利用了一个硅基板作为中介层,缩短了芯片之间的距离,从而提高了信号的传输速度和质量。

而BLink则在中介层上,建立了一个专用的接口,它可以让多个芯片之间直接传输数据,而不需要经过其他的电路或芯片,从而减少了延迟和功耗。

然而,尽管2.5D CoWoS、BLink这些技术,让壁仞科技打造出了算力更强的BR100,但这些技术,目前在国际上并不罕见,其他GPU厂商也有过类似的设计。

例如,Nvidia的A100和H100 GPU都采用了CoWoS技术,把GPU芯片和HBM内存堆叠在一起,提高了内存带宽和计算性能。而Nvidia还开发了自己的NVLink接口,类似于BLink接口,可以让多个GPU之间高速互联。

此外,AMD也有自己的Infinity Fabric接口,可以实现类似的功能。

那既然这是一种“大家都能用”的技术,那壁仞科技怎么就做到让BR100算力达到A100三倍的呢?而英伟达真就会坐视着自己被超越了?

其实,这样的结果,是二者在不同数据格式下的表现所致。

具体来说,BR100的巨大算力,更多是在矩阵FP32数据格式下的表现。

一般来说,数据格式占用的位数越多,它的范围和精度就越高,但是也会消耗更多的空间和电力。

而矩阵FP32其实就是一种特殊的FP32数据格式,它只用了19位来存储一个浮点数,这样做的目的是为了让矩阵FP32能够兼容Tensor Core这种专门用于加速矩阵乘法的硬件单元。

矩阵乘法是深度学习中最常见和最重要的计算操作之一,所以使用矩阵FP32可以大幅提升深度学习的性能。

但是,矩阵FP32也有一个缺点,就是它的精度比向量FP32低,也就是说它能表示的浮点数的范围和细节程度比向量FP32小。

这样就会导致一些误差和损失,在某些情况下可能会影响模型的质量和效果。

因此,矩阵FP32和英伟达A100的向量FP32并不等价,因为矩阵FP32只适用于矩阵乘法这种特定的计算操作,并不能代表GPU的整体性能。

02 生态之痛

除了技术方面的较量外,软件生态上的壁垒,也是国产GPU无法忽视的一道屏障。

从某种程度上说,这样的壁垒比某些具体技术的难点,更难以攻克。

在GPU领域,业界流传着一种说法:“CUDA是Nvidia最深的护城河”。

这是因为,早在十几年前,在业内大部分人都认为GPU只能处理图形相关的计算时,英伟达就已经意识到了GPU在AI领域的潜力和价值,并开始了相应的布局,在2006年推出了通用并行计算架构CUDA。

在CUDA问世前,人们在进行各种计算任务时,用的都是CPU,而非GPU。

然而,CPU虽然具有很强的“通用性”,可以处理各种计算,但是它的速度不够快,而且核心数量有限。

而相较之下,只能处理图形计算的GPU,不仅速度很快快,而且有很多很多的核心。

通过CUDA,在进行AI计算时,人们可以将神经元之间的计算分配到GPU的不同核心上,并行地进行运算。这样就大大提高了神经网络的训练和推理的速度、效果。

英伟达看到了CUDA的巨大潜力,于是不断地完善和优化CUDA的技术和生态。

例如让CUDA支持C、C++、Fortran、Python等多种编程语言,或是提供了针对不同领域和应用优化的库和工具,比如图像处理库、深度学习库、自动驾驶库等等。

这样的优化,为开发者提供了极大的便利,使其不用再学习新的编程语言,或是从头开始编写代码。

于是,越来越多的人用惯了,用舒服了,CUDA的生态就这么被搭建起来了。

诚然,在CUDA构建自身生态壁垒的过程中,也不是没有遇到过竞争者,但最后这些对手都一一成为了“陪跑者”。

例如,苹果公司和Khronos Group在2009年推出的OpenCL,也有过想成为行业标准的想法,让人们可以用不同厂商的CPU、GPU、来做异构计算。

然而,OpenCL没有CUDA那么高效和灵活,需要更多的编程技巧和优化工作,这就加大了开发者的负担。

而英伟达的老对手AMD,也想要提供一个通用并行计算平台,并推出了相应的产品ROCm,它跟CUDA的架构非常类似,甚至有一个工具叫hipify,可以把CUDA代码转换成ROCm代码。

但是ROCm只能用在AMD的GPU上,而且只支持几款显卡。

于是,综合对比下来,更多的开发者还是选择了“通用性”、“易用性”都更胜一筹的CUDA。

如今,在软件生态方面,壁仞科技也推出了自主研发的BIRENSUPA软件平台,试图通过“无缝运行”的方式,让开发者无需修改代码,就可以在BR100系列产品上运行原本基于CUDA的应用。

这样,习惯了使用CUDA的用户,如果转而使用BR100系列产品,可以获得更高的计算性能和更低的功耗成本。

然而,这样的思路,却面临着几大挑战,而其中之一,就是BR100系列产品在通用计算生态上的支持。

BIRENSUPA软件平台

因为,壁仞科技为了提高BR100系列产品在AI计算方面的性能和能效,也对流处理器进行了一些优化和定制,比如说使用BF16替代FP16作为主要的数据格式,以及增加了一些针对AI的硬件指令和功能。

这样,BR100就可能牺牲了部分通用计算能力,导致其在一些非AI的应用场景和领域上表现不佳或者不兼容。

而这也是为什么,BR100的主要应用场景,大多是复旦大学、清华大学这类高校的人工智能计算和高性能计算项目。

除此之外,BR100系列产品,在算力利用率上也存在着风险。

虽然,BR100的架构是通用的,如果如果壁仞科技愿意,也同样可以将其用于通用类的计算。

但因为BR100的内部算力带宽已经明显超过PCIe和HBM2e的带宽,所以绝大部分数据可能都要在GPU内流转。

这就意味着,虽然BR100的算力很强大,它的数据来源和输出通道,都不够快,不能及时地给它送来或者拿走数据。

而如果一个软件生态主要支持通用处理, 它的GPU芯片往往就需要有足够高的外部带宽,来获取各种类型的数据。

这是因为,不同类型的应用,往往对带宽的需求和敏感度都不同。一些大型的应用,可能需要更高的带宽,才能更好地计算。

最后,也是最具风险的一点,就是虽然壁仞科技宣称,BR100要无缝地支持CUDA生态,但CUDA不是一个开源生态,英伟达在其中埋下了大量专利壁垒。

如果壁仞科技真的打算撬动这块壁垒,则很可能受到英伟达的在专利上的反击。

综上所述,虽然目前在国产GPU突围的道路上,部分厂商已经走出了自己的路,但鉴于硬件、生态等各方面的差距,这样的道路,必定是一条充满荆棘的长路。

上一篇:电脑读书软件哪个好_电脑用什么读书软件好 下一篇:最后一页
x
推荐阅读

国产替代狂奔,中国版英伟达何时现身?

2023-07-11

电脑读书软件哪个好_电脑用什么读书软件好

2023-07-11

T-Mobile即将为iPhone XS和XR推出自己的eSIM应用程序

2023-07-11

降成本担风险!浙江椒江引金融活水润泽乡村沃土

2023-07-11

港股造车新势力大涨 蔚来汽车涨超11%

2023-07-11

劳资协议讲解|范乔丹合同中有15%交易保证金!什么是交易保证金?

2023-07-11

大行评级 | 花旗:对美高梅中国展开30日催化上行观察

2023-07-11

创新发展看人大|青岛市黄岛区人大:探索新模式 打造代表与群众互动系统

2023-07-11

遏制“指尖”浪费须压实网络餐饮平台责任

2023-07-11

首轮中段秀连夏季联赛都打不明白,灰熊的选人眼光太差了?

2023-07-11

离婚了,所以完全不藏了

2023-07-11

交口:智慧畜牧龙头产业

2023-07-11

第十期巡回调研第23站:走进能建时代(上海)新型储能技术研究院有限公司

2023-07-11

润和软件:中标某全国性股份制银行网络渠道运营维护服务项目

2023-07-11

赋能千行百业,盘古大模型的底气从何而来?

2023-07-11

各省绿色金融数据(1990-2022)

2023-07-11

每天一句心情签名 每日一句心情签名

2023-07-11

文班亚马开启负荷管理?夏联主帅透露或缺席剩余比赛 身材瘦削防受伤

2023-07-11

湖南省消费者权益保护工作联席会议2023年全体会议在长沙召开

2023-07-11

电梯内被异物扎到担心感染,女子报警希望警方查明真相......

2023-07-10

印度神油多少钱一瓶(印度神油)

2023-07-10

长安UNI-K 智电iDD的预约充电体验,让充电更方便?

2023-07-10

北京市体育竞赛管理和国际交流中心关于举办2023年北京市青少年U系列冰壶冠军赛暨北京市第二届冬季运动会(青少年竞技组)冰壶比赛预赛的通知

2023-07-10

深夜1500斤重大水牛被撞死,交警快速破案村民获赔4万

2023-07-10

终于谈成了?知情人士透露新疆正式送出周琦!

2023-07-10

加多宝回应被判赔广药3.17亿元,将提起上诉

2023-07-10

济南大学每月给留学生补助3万元?警方:网民为博人眼球故意拍摄部分照片,已严肃处理

2023-07-10

安阳市率先实施“一业一册”综合监管

2023-07-10

唐太宗韦贵妃简介,生平又是什么样的?

2023-07-10

1799元起!WIKO Hi 畅享60 Pro手机发布:鸿蒙生态支持5G

2023-07-10

07月11日南泥湾大道计划施工停水公告

2023-07-10

常长亭:串串阴线中却酝酿着大机会

2023-07-10

君妍医美余杭分院盛大启幕,成功打造品牌连锁“科学新医美”闭环

2023-07-10

市中医伤科医院召开“三甲”复审工作动员大会

2023-07-10

【机构评级】 麦格理:维持中国中免(01880)“跑赢大市”评级 目标价上调至197港元

2023-07-10

苏州迎来首家碳中和三甲医院

2023-07-10

《潜水员戴夫》全BOSS打法视频攻略

2023-07-10

我国登记在册民营企业突破5000万户

2023-07-10

成都大运会新都赛区大运场馆闭馆通知

2023-07-10

长春12.25亿元成交4宗宅地 旭辉1.32亿元摘1宗

2023-07-10

microsoft store中文设置教程

2023-07-10

「志愿风采」送法进校园 花儿乐开颜

2023-07-10

台湾青年莆田“寻根”携手传承妈祖文化

2023-07-10

净值多日纹丝不动或已空仓 基民“讨说法”

2023-07-10

首家中轴线主题邮局亮相宏恩观

2023-07-10

强对流天气预警!5省份部分地区将有雷暴大风或冰雹

2023-07-10

哈弗高管回应“销售顾问播放竞品视频”:非系统性行为

2023-07-10

高温橙色预警:北京、河北、河南及浙江、福建等局地可达40℃以上

2023-07-10

海贼王1068:大妈战败凯多痛哭,最终之战,路飞发动最后的四档

2023-07-10

木塑板(对于木塑板简单介绍)

2023-07-10

旧物循环再利用 南国卖报小行家“旧货跳蚤市场”交易忙

2023-07-09

恒生电子牵手华为云 共同推进大模型金融场景创新

2023-07-09

我国登记在册民营企业突破5000万户

2023-07-09

空间几何体的表面积和体积公式 空间几何体的表面积和体积

2023-07-09

第16届昆明国际民族民间工艺美术品博览会举办

2023-07-09

加速全面向新 领克品牌用户中心(西湖)将直面用户、直接服务

2023-07-09

文明互鉴与文化强国建设研讨会在京举办

2023-07-09

蟾蜍和癞蛤蟆的区别

2023-07-09

设立AI创新实验室,施耐德电气以两大支柱助推AI产业化

2023-07-09

香烟在汽车养护中的5大作用

2023-07-09

下周前瞻:6月CPI、PPI数据公布,A股10只新股申购,中国电建、中国东航解禁市值超百亿

2023-07-09

“推动地区和平、安全与发展”

2023-07-09

工业酒精厂家(工业酒精)

2023-07-09

美国批准向乌克兰提供集束弹药 遭多方反对

2023-07-09

开封养老保险转移指南(开封养老保险咨询电话)

2023-07-09

奥莱康桥·明月湾|城市级配套 占据未来优渥生活圈

2023-07-09

海口龙华区推出房屋租赁登记备案续证“无感智办”

2023-07-09

30年来最大规模“变身”!记者探访大运会场馆四川省体育馆→

2023-07-08

开启申购!光伏新技术平台供应商时创能源发行价19.2元/股

2023-07-08

山东释放产业集群“磁吸效应” 为经济发展增添强劲动能

2023-07-08

原神3.8活动一阶段后续彩蛋位置在哪

2023-07-08

盐津铺子预计上半年净利润不低于2.4亿元

2023-07-08

所有人,商洛再添康养休闲遛娃好去处!

2023-07-08

Set a light 3D Studio v2.5.9中文汉化3D摄影棚布光软件安装教程

2023-07-08

美国主播:可卡因在白宫战情室附近被发现 普通人进不去

2023-07-08

中国第一软饭男:给大38岁美国富婆当儿子情人,晚年却过的太凄惨

2023-07-08

净身出户支付抚养费吗?

2023-07-08

“烦恼指数”如何降下来?

2023-07-08

证监会:支持公募基金管理人及其他行业机构合理调降基金费率

2023-07-08

有色行业报价预警:广东南储有色现货市场钴价格4周暴涨17.78%(20230707)

2023-07-08

《尘缘》顾清为什么拼死救纪若尘?

2023-07-08

火箭官宣签下三人:狄龙签换细节仅送4次轮 范乔丹直言必入季后赛

2023-07-08

锚定“稳增长”更多货币政策工具可期

2023-07-08

企业内可同时进行5场在线会议 腾讯会议开始调整

2023-07-08

大学教材(关于大学教材的基本详情介绍)

2023-07-08

中概股走强 阿里巴巴涨超4%

2023-07-08

新增3家公司主动“撤单” 7月沪深两所IPO终止企业已达7家

2023-07-07

财付通被罚没近30亿元,共收到5张罚单

2023-07-07

海外new things | 信用卡巨头Visa以10亿美元收购巴西支付平台「Pismo」,将为客户提供更具差异化的服务

2023-07-07

安阳钢铁拟开展2亿元融资租赁业务,期限3年

2023-07-07

接连热出新纪录,15座“空调山”等你来避暑!京津冀环游记,出发

2023-07-07

2连板比依股份:公司目前生产经营活动一切正常

2023-07-07

学车自动计时、耕地无人驾驶、铁塔自动监测……湖北北斗推开万物互联时空大门

2023-07-07

联合打击整治!山东省今年已打掉非法社会组织58家

2023-07-07

【聚焦“三个年”·看环境】听民意解民惑!“杨舒资讯”直播间“点赞+关注”走一波~

2023-07-07

上汽集团6月销量40.6万辆

2023-07-07

唯一b股上市航司今日涨停退市,还有哪些航司资不抵债

2023-07-07

中方:敦促美方纠正错误行径,为双方开展禁毒合作创造必要条件

2023-07-07

工行30万大额存单一年利息多少?大额存单的优缺点?

2023-07-07

美反战组织联合创始人:集束弹药将使乌克兰未来数十年承受后果

2023-07-07