服务器和gpu的关系（服务器gpu有什么用）〔服务器和gpu的区别〕

时间：2024-07-12 编辑：小孩姐浏览：41

大模子 AI席卷环球，推理创新的APP、场景落地越来越多。当练习到达肯定阶段，推理肯定会形成一个发作。推理的产物要起来，肯定要把推理的本钱降到本日 1/ 10 乃至 1/100。此时该怎样选好、用好 GPU ，进而影响推理本钱？

服务器和gpu的关系（服务器gpu有什么用）服务器和gpu的关系（服务器gpu有什么用）〔服务器和gpu的区别〕新闻资讯

近来， LiveVideoStack荣幸地约请到PPIO的王闻宇老师担当采访。本文将从芯片怪兽英伟达公司把持式增长和美国“卡脖子”2个热门题目出发。围绕已往、如今、将来三个时间线为各人梳理GPU的劈头及其软硬件技能的更迭；同时，深度分析 GPU主流产物的参数和技能发展近况，并连合当前GPU的微架构计划，给出算力工程优化的几个思考和有效办理方案。

媒介：算力与GPU

算力，即盘算本领（Computing Power）。更具体来说，算力是通过对信息数据举行处理惩罚，实现目标结果输出的盘算本领。

最早的算力引擎。是人类的大脑，厥后演变成草绳、石头、算筹（一种用于盘算的小棍子）、算盘。到了20世纪40年代，天下上第一台数字式电子盘算机ENIAC诞生，人类算力正式进入了数字电子期间。再厥后，随着半导体技能的出现和发展，我们又进入了芯片期间，芯片成为了算力的重要载体。进入21世纪后，算力再次迎来了巨变，云盘算技能出现，算力云化之后，数据中心成为了算力的重要载体。人类的算力规模，开始新的飞跃。

我们通常将如今负责输出算力的芯片，分为通用芯片和专用芯片。专用芯片，重要是指FPGA（可编程集成电路）和ASIC（专用集成电路）。像x86如许的CPU处理惩罚器芯片，就是通用芯片。它们能完成的算力任务是多样化的，机动的，但是功耗更高。

游戏、数字货币挖矿、AI、科学盘算等各方面都必要 GPU ，GPU成为了当下的关键题目。下面我就围绕GPU以及对算力整个行业的思考睁开分享。

2023年两个变乱的遐想：

变乱一：英伟达芯片怪兽一家独大！市值突破万亿美金

5月30日的时间，发生了一件庞大的事变，5月30日美股买卖业务时段，英伟达市值一天内暴涨超2000亿，突破 1万亿美元大关，英伟达的市值宏大于Intel、AMD 、高通，MTK的总和，乃至是其他公司的10倍；再看英伟达公司的PS、PE指标，可以看出综合环境黑白常良好的。

那么，英伟达芯片怪兽的职位是怎样形成的？我在文章的末了会分析。

变乱二：美国卡脖子题目再次升级！

上图所示的卡型至少有一款是AI范畴必备的卡型，但是令人遗憾的是，由于美国卡脖子题目再次升级，以上卡型全部被纳入禁售名单。

已往篇

1.1

为什么必要 GPU？

CPU的定位是通用盘算芯片，有强大的调治，管理，和谐本领，应用范围广，机动性最高，善于逻辑控制，串行的运算。

GPU的定位是并行盘算芯片，重要是将此中非常复杂的数学和多少盘算抽出，变成一个超高密度、可以或许并行盘算的方式。最初专用于图形处理惩罚，后渐渐用于高密度通用盘算，包罗 AI盘算。

1.2

GPU的劈头

GPU 的发展源于80年代，IBM是GPU理念的首创者，但它并未对峙。以是真正意义上的第一款GPU是英伟达在1999年发布的Geforce 256 ，并正式提出一个响亮的名字“Graphics Processing Unit ”，这就是GPU的泉源。以后之后，GPU不停高速发展。

图：这是第一款真正意义的GPU的照片

1.3

GPU的天下就是“两位华人之间的战役 ”

各人常说，GPU的天下就是“两位华人之间的战役 ”。英伟达的首创人黄仁勋是美籍华人，黄仁勋的外甥侄女苏姿丰是AMD的CEO 。也就是说，英伟达与AMD两大巨头企业的CEO是亲戚关系，把握了全天下最强大的两个GPU。假如再加上TSMC（台积电）也是华人，可以说华人主宰了尖端半导体行业的半壁江山。

这GPU公司的竞合汗青：

上图为GPU发展过程图，可以看出3dfx早期发展迅猛，2000年以不到一亿美金的估值被英伟达收购，ATI是AMD显卡的前身，2006年被AMD收购，以是后期根本为英伟达与AMD双雄争霸。

留意，这个图中好像少了谁，就是闻名的Intel。着实 Intel在1998年发布了绝版独立显卡i740，在此之后的23年，就没有再发布过独立GPU，聚焦在做集成显卡，退出了GPU市场，如今看来，这不是明智的战略选择。直到2022年，Intel终于看到AI发展的趋势，才发布了新的独立显卡系列，这就是ARC系列。

GPU早期是为了用于图形渲染

GPU早期一样平常为了3D渲染而计划。从盘算机图形学的角度，GPU将三维变乱的点阵通过矩阵变革投影到二维平面上，这个过程叫做光栅化，终极在表现器上结果。GPU的本领根本上是顶点处理惩罚、光栅化、像素处理惩罚等，这个过程包罗大量的矩阵盘算，刚好利用了GPU的并行性。

厥后，GPU在计划上走向了通用盘算。

2003年，GPGPU（General Purpose computing on GPU）的概念被初次提出来。GPU不再以图形的3D加快为唯一目标，而是可以或许用于恣意并行的通用盘算，比方科学盘算、数据分析、基因、云游戏、AIGC等。

直到2009年英伟达初次推出Tesla系列后，GPGPU期间才真正到临。

如今国内有很多做GPU的公司，大部分都投入在GPGPU范畴，这些公司都放弃了图形渲染，直接以高密度的并行盘算作为发展方向。

以英伟达的产物来举例，有如下产物系列

第一个用于游戏范畴，包罗 GeForce系列、RTX系列，我们常说的4090就是属于游戏范畴的系列；常说的x0y0编号就是GeForce系列。

第二个用于数据中心范畴，包罗 Tesla系列，常提到A100 、H100就属于这一系列。英伟达有要求，不答应游戏范畴中的GeForce系列进入数据中心。因此英伟达游戏系列的产物在同样芯片、同样算力的环境下，GeForce系列的代价要比Tesla系列低3~5倍。正由于代价相差太大，如今国内做大模子推理、StableDiffussion图形天生等都以4090作为首选的缘故起因；

第三个是用于高端图形范畴，包罗 Quadro系列；这款在工业范畴用得多。

第四个是用于汽车范畴。

服务器和gpu的关系（服务器gpu有什么用）服务器和gpu的关系（服务器gpu有什么用）〔服务器和gpu的区别〕新闻资讯

GPU支持与架构的不绝优化

这是是英伟达的硬件架构变迁图。随着2007年英伟达推出 CUDA 1.0版本，使其旗下全部 GPU 芯片都顺应 CUDA 架构：

CUDA生态和代价也是英伟达的最核心竞争力，也是英伟达万亿市值的关键因素之一。英伟达投入了一万以上的工程师在发展这个体系，根本上把人工智能里的大部分场景都做了深度优化。英伟达长期投入CUDA生态建立，为开辟者服务，创建好了一系列的开源生态。

如今篇

2.1

先辈的微架构计划

如今的GPU根本利用微架构计划，以最早的Fermi架构开始（2010年），当时候一个GPU是由4个GPC（图形处理惩罚簇 Graphics Processing Clusters）、16个SM（流多处理惩罚器，Stream Multiprocessors ）以及512个CUDA Core（向量运行单位）构成的，这是GPU的特性。

着实图形渲染也是微架构的（以 2018年 Turing 微架构为例）

RT Core（RT核心）非常关键，实现了当代 GPU中的光线最闭幕果。渲染结果中最紧张的是光追，看这张光追低级结果和光追高级结果的对比图，差距非常显着，折射、反射、光影都出现出很大的差距。

着实如今的手机GPU根本上都带有光追的结果和本领，但是手机的光追结果对比英伟达GeForce 40系列GPU的光追结果差距很大。一份最新的评测将英伟达 4070与高通GEN2举行对比，各个指标综合得出差距为25倍，纵然用最好的手机也不大概体验到英伟达 4070渲染出来的结果。这也是云游戏创建的根本逻辑，让玩家在手机上也能体验到强大的GPU渲染所带来的的画质结果。

我们看看如今最新一代GPU的环境：

最新的 Ada Lovelace 架构(如Geforce RTX 4090)

看看最新的Ada架构，也就是4090这一代，这是完备的管线图，密度相较于之前大大进步，仍旧是微架构体系。

我们放大看看GPC：

我们再放大看看SM ，是不是和前面Turing架构的SM很像：

别的，和Ada架构GeForce系列平行的是Hopper架构的Tesla系列，也就是传说中的H100/H800 ，这两个架构的管线大抵是雷同的，特别阐明的是Tensor Core中的内容是完全一样的，以是在Ada架构的4090上也可以很好地发挥Hopper架构AI的特性。但Ada架构与Hopper架构最关键的区别，Ada不知道多卡高速互联，也就是NVLink/NVSwitch这套技能。

关键词：

上一篇：网络节点标准（网络节点分为几类）〔网络节点一般分为哪些类别〕

下一篇：在线查询网站源代码（在线查察网页源代码工具）〔在线查看网页源代码工具〕

搜索

标签列表

最新留言

服务器和gpu的关系（服务器gpu有什么用）〔服务器和gpu的区别〕

关键词：

搜索

标签列表

最新留言

服务器和gpu的关系（服务器gpu有什么用）〔服务器和gpu的区别〕

关键词：

更多推荐