联想 ThinkStation P920 塔式工作站评测 Quadro RTX 8000

Admin 2253 2021-08-29 14:18

Lenovo ThinkStation P920 Workstation Tower 是一头野兽,高度可配置,可以放置大量数据并快速处理许多不同类型的工作负载。借助多达三个 NVIDIA Quadro GV100,您拥有 NVIDIA 为需要极快 HBM2 内存的工作负载而打造的最强大的 GPU;或者,如果您的工作负载只需要大量 GPU 内存,您可以通过随附的 NVLink 获得两个 NVIDIA Quadro RTX 8000,总共 96GB 的视频内存。如果您的工作负载更受 CPU 限制,联想也可以满足您的需求,最多支持两个 Xeon Platinum 8280,4.0GHz 下的 56 核和 112 线程。

1.jpg

该工作站的用例范围从建筑设计到 CAD,再到好莱坞级别的 VFX,或者只是编辑 8K 的高分辨率素材。无论您的个人使用情况如何,这些都可以定制配置。基本配置的起价为 2,354.22 美元(截至 2020 年 8 月,正常建议零售价为 4,059 美元,但经常销售),但如果您真的愿意,您可以轻松检查所有复选框并飙升至 50,000 美元以上;老实说,谁不喜欢弄乱在线配置器来看看你能走多高?

在这篇评论中,我们将重点关注这台机器的媒体和内容创建方面,检查 Blender 渲染、Davinci Resolve 性能与 8k RED 素材、V-Ray 以及希望与您的工作相关的其他内容。这是对该系统的后续审查,可以在此处找到我们对 P920 的第一次审查。

Lenovo ThinkStation P920 Tower 规格

构成因素
处理器 最高双 Intel Platinum、Gold、Silver 和 Bronze(最多 28 个内核,每个 CPU 最高 4.4 GHz)
操作系统 适用于工作站的 Windows 10 Pro(可通过 Microsoft 升级) Ubuntu Linux1 w/ Nvidia RAPIDS(预加载) Redhat Linux(已认证)
记忆 高达 2TB DDR4 2933 MHz,16 个 DIMM(同时支持 RDIMM 和 LRDIMM,最大 256GB DDR4 ECC 3DS-RDIMM)
芯片组 英特尔 C621
贮存
最大限度 总共多达 12 个驱动器 多达 4 个内部存储托架 最大板载 M.2 = 2 (4TB)(最多 9 个 PCIe 适配器) 最大 3.5" HDD = 6 (60TB) 最大 2.5" SSD = 10 (20TB) 最大 PCIe AIC = 2 (960GB)
支持的驱动器媒体 3.5" SATA HDD 7200 rpm 最高 6TB 2.5" 10k SAS HDD 最高 600GB 2.5" SATA SSD 最高 2TB M.2 PCIe SSD 最高 1TB PCIe 附加卡最高 480GB
移动存储 9 合 1 介质卡(标准) 15 合 1 介质卡读卡器(可选) 9.5 毫米超薄光驱(可选)
支持 RAID 0, 1, 5, 6, 10
电源 14000W @ 92%
图形 的NVIDIA Quadro GV100 32GB 的NVIDIA Quadro 8000 RTX 48GB 的NVIDIA Quadro 6000 RTX 24GB 的NVIDIA Quadro P6000 24GB 的NVIDIA Quadro 5000 RTX 16GB 的NVIDIA Quadro P5000 16GB 的NVIDIA Quadro 4000 RTX 8GB 的NVIDIA Quadro P4000 8GB 的NVIDIA Quadro P2200 5GB 的NVIDIA Quadro P1000 4GB 的NVIDIA Quadro P620 2GB
端口
正面 4×USB 3.1创1(A型) 麦克风 耳机 2×USB-C /雷电3(可选) 媒体卡读卡器
后部 4 x USB 3.1 Gen 1(A 型) 2 x USB 2.0 USB-C(可选) Thunderbolt 3(可选) 串行(可选) 并行(可选) 2 x PS/2 2 x 以太网 音频输入 音频输出 麦克风-in eSATA(可选) 火线(可选)
可选的附加连接 英特尔无线 8265 AC WIFI + 蓝牙 4.2 英特尔 I210-T1 单端口千兆以太网适配器 英特尔 I350-T2 双端口千兆以太网适配器 英特尔 I350-T4 四端口千兆以太网适配器 X540-T2 双端口铜
扩展插槽 5 x PCIe x16 Gen 3 3 x PCIe x4 Gen 3
尺寸(宽x深x高) 7.9” x 24.4” x 17.6”(200 毫米 x 620 毫米 x 446 毫米)
安全 可信平台模块 (TPM 2.0) 串行、并行、USB、音频、网络、启用/禁用端口控制 开机密码 设置密码
保修单 3年

此外, 请查看这份方便的 PDF,其中包含截至 2020 年 6 月的 P920 的完整可配置规范(数量很多;我们并没有说它的可配置性如何)。

设计和建造

联想 ThinkStation P920 是一款塔式工作站,它的构造就像一个坦克。它主要由钢制成,也与坦克一样重,最重的配置超过 80 磅(> 37 公斤)。它绝对是一台联想机器,外壳为黑色,带有红色高光。它是低调的,除了庞大的尺寸外,不会在您的工作站上大惊小怪。

2.jpg

工作站的后部主要是通风(它绝对需要)和足够数量的 I/O。它还暗示了这台机器可以在两个 Quadro RTX 8000 可见的地方提供的性能。还可以看到它的 8 个 PCIe 插槽和一个可选串行端口所在的打孔。

3.jpg

机器内部布局合理,可以方便地使用 PCIe 插槽和 DIMM 插槽,以便将来升级和扩展。此外,前面的 FlexBay 和用于存储驱动器不同配置的空间也很容易接近。整个东西是令人难以置信的模块化,几乎所有用户可维修或 IT 可维修的东西都是免工具的,包括整个 PSU 和机箱风扇。

说到风扇,在我们广泛的测试中,这台机器保持安静。即使在满载情况下,GPU 风扇也几乎没有加速,同时保持完整性能。诚然,您可能会在两个处理器和两个 GPU 承受压力的情况下为单户住宅供暖,但这实际上只是在人工压力测试或渲染下,而不是正常工作的典型情况。说到工作,让我们来看看好东西!

联想 ThinkStation P920 性能

我们在这里测试的配置几乎是一流的,但更适合 GPU 繁重的工作负载,特别是需要大量 VRAM 的 CUDA 加速任务,而不是 CPU 繁重的工作负载。我们的系统运行 Windows 10 企业版,并配备两个 Xeon Gold 6234 (8c/16t) 总容量为 16c/32t、192GB 的 DDR4-2933、一个 1TB NVMe SSD 和一块电阻,两个 NVIDIA Quadro RTX 8000s 总共 96GB 的 VRAM。我们还投入了一个双端口 10GbE 卡用于测试目的,以消除数据瓶颈。剧透警告,这对这个怪物来说还不够。我们将把它与各种各样的机器进行比较,特别是与配备 Ryzen 9 3900X 和 NVIDIA GTX 980Ti 的系统以及相同的系统但配备单个 Quadro RTX 8000 的系统进行比较。

让我们从这个工作站没有规范的一件事开始,那就是 CPU 性能。我们运行了 Cinebench R20,并在多线程测试中获得了可观的 7169。作为参考,消费级 AMD Ryzen 9 3900X (12c/24t) 得分为 7247,这是有道理的,尽管 Ryzen 的线程数减少了 8 个,但它在时钟速度方面具有约 1.1GHz 的优势,不考虑 IPC 和 7nm 与 14nm 以及所有因素那(这真的是一个苹果与橙子的比较,为了简洁起见,我们过于简单化了)。

4.png

这显然不是一个很好的比较,但它是 CPU 性能的一个不错的参考框架。同样,不是针对此特定配置进行优化的内容;更高的内核数和更快的时钟将大大提高 CPU 分数,并且可以作为选项提供。

现在,让我们来看看好东西!接下来,我们运行了LuxMark 3.1,这是 GPU 的 OpenCL 基准测试。不出所料,P920 在这里表现良好。双 GPU 确实发挥了作用,使 Ryzen 系统中单个 RTX 8000 的得分增加了一倍多,额外的 VRAM 也是一个促成因素。

LuxMark
GPU 结果
P920 P4000 15,303
P920 P5000 13,170
锐龙 3900X + 980Ti 16,270
P920 RTX 5000 29,404
锐龙 3900X + RTX 8000 37,427
P920 2x RTX 8000 75,614

下一个基准是 SPECviewperf 13,它是基于专业应用程序测量图形性能的全球标准。SPECviewperf 13 运行 9 个它称为视图集的基准测试,所有这些基准测试都代表来自实际应用程序的图形内容和行为。这些视图集包括 CATIA、Creo、Energy、Maya、Medical、Showcase、Siemens NX 和 Solidworks。我们将它与 ThinkPad P72 和之前对 P920 工作站的评测进行比较。您可以在此处找到有关该测试设置的更多信息。

SPECviewperf 13
视图集 ThinkPad P72 P920(以前的评论) P920(当前)
3dsmax-06 153.14 153.3 258.38
catia-05 252.76 242.6 323.22
Creo-02 222.95 214.74 329.58
能源-02 35.68 22.01 72.82
玛雅-05 232.12 265.82 352.98
医疗-02 55.51 68.64 148.24
展示-02 70.38 132.59 183.96
SNX-03 344.37 673.18 508.94*
sw-04 156.88 128.86 188.57

* 这似乎是一个异常,尤其是与其他分数相比。SPECworkstation 的 Siemens NX 测试虽然没有在此列出,但更符合预期。

正如预期的那样,当前 P920 的双 GPU 设置使 SPECviewperf 快速工作,尤其是与之前 P920 评测的单个 NVIDIA P6000 相比。

此外,我们还运行了 SPECworkstation3,这是一个专门为测试工作站性能的所有关键方面而设计的基准测试;它使用 30 多个工作负载来测试 CPU、图形、I/O 和内存带宽。工作负载分为更广泛的类别,例如媒体和娱乐、金融服务、产品开发、能源、生命科学和一般运营。我们将列出每个工作负载的大类结果,而不是单个工作负载。结果是每个类别中所有单个工作负载的平均值。

SPEC工作站3
类别 ThinkPad P72 P920(以前的评论) P920(当前)
1.93 2.85 3.31
产品开发 1.82 3.04 3.47
生命科学 1.61 3.23 3.62
活力 1.18 2.07 2.14
金融 1.58 4.79 3.65
一般运营 1.46 1.79 2.06
GPU计算 2.53 3.06 6.7

在这里,ThinkStation 在 P72 之前突出了台式机与移动设备的差异。它还强调,在 GPU 计算中,那些双 RTX 8000 真正发挥了多大的作用。

接下来我们将看看Chaos Group 的 V-Ray。V-Ray 是一个 3D 渲染插件,广泛应用于建筑可视化、广告和影视视觉效果。它可用于许多最常见的 3D 建模应用程序,并且像那些 3D 建模应用程序一样,非常依赖 GPU 的性能。

5.png

联想 ThinkStation P920 的 CPU 得分为 21,259,GPU 得分为 895。作为参考,单颗RTX 8000搭配Ryzen 3900X的GPU得分为503,而差劲的980Ti只得了303,3900X CPU得分则是20368。如果您想更广泛地了解这些性能得分的含义,请查看此链接以了解它与类似系统的得分情况。P920 在这方面做得非常好。

接下来,我们将使用官方Blender Open Data Benchmark 工具查看一些 Blender 渲染。我们将使用 OptiX 后端的 Cycles 引擎对 BMW、Classroom 和 Fishy Cat 演示文件进行基准测试,该引擎通过 NVIDIA RTX GPU 提供硬件加速的光线追踪。这是 Blender 2.81 的新功能,仅适用于 RTX 卡,因此我们的 980Ti 测试基于 CUDA。P920 上的测试是使用完整的 Blender 应用程序完成的,因为基准工具目前不支持多 GPU 设置;这不会影响结果。

6.png

 

搅拌机项目 锐龙 3900X + 980Ti (CUDA) 锐龙 3900X + RTX 8000 (OptiX) 联想 P920 (OptiX)
宝马 01:52.20 00:23.03 00:12.70
课堂 06:01.53 01:25.93 00:56.08
鱼猫 04:12.79 00:33.67 00:32.78

除了 OptiX 后端比 CUDA 更高效之外,Quadro RTX 8000 非常适合 Blender。P920 在这方面的表现非常出色,因为 Blender 可以在多个 GPU 上很好地扩展,而 96GB 的 VRAM 意味着即使是大型 Blender 项目也可以及时渲染。上面的链接有来自不同 GPU 的其他基准测试结果可供比较。这次我们选择跳过 CPU 测试,因为测试配置没有针对 CPU 工作负载进行优化。另外,值得注意的是,Fishy Cat 的结果有点奇怪,因为我不认为该项目针对多 GPU 设置进行了优化,因此结果与单个 Quadro RTX 8000 相似。无论如何,这台机器对于 Blender 来说是惊人的。

最后,我们将看看 Davinci Resolve 中的一些实际用例。这些结果将类似于您在 Adobe Premiere Pro 和 Adobe Media Encoder 中可以找到的结果,最新版本支持 GPU 加速 H.264 和 H.265 渲染,并在 GPU 加速效果方面具有出色的性能。Davinci Resolve 拥有针对 GPU 加速优化的大部分内容,并且还原生支持多个 GPU。

此测试背后的方法是查看直接渲染的性能和使用 GPU 重度效果的渲染的性能。直接渲染模拟了一种场景,您需要为编辑或样片转码大量素材,我个人在日常工作中经常遇到这种情况,尤其是在处理高分辨率素材或原始素材时。用于此的三个素材源是来自 Blackmagic URSA 的 4.6k CinemaDNG RAW 文件,可在此处找到(直接下载)、24fps 的 RED Gemini 5k 全帧素材和 24fps 的 RED Helium 8k 全帧素材,两者都可以在这里找到. 我们使用的效果是水彩、浮雕 (Sobel) 和高斯模糊。这些文件是通过 10GbE 的 2U FreeNAS 服务器通过网络提供的,但正如您将看到的,即使 10GbE 网络完全饱和对于其中一些剪辑来说也不够快。

 

时间轴(剪辑长度) 锐龙 3900X + 980Ti 锐龙 3900X + RTX 8000 联想 ThinkStation P920
室内办公室 – CinemaDNG (00:44+14f)


H.265 母版,4.6k 00:39* 00:23 00:21
H.264 母版,1080p 01:05 00:20 00:18
FX、H.264 1080p 02:14 01:01 00:37
FX、H.264 4.6k 不适用* 04:47 03:01
氦气 8k FF (00:22+22f)


H.265 母版,8k 00:27* 00:32** 00:32**
H.264 母版,1080p 00:22 00:13** 00:13**
FX、H.264 1080p 01:19 00:37 00:25
FX、H.264 8k 不适用* 07:41 04:34
双子座 5k FF (00:07+23f)


H.265 母版,5k 00:09* 00:06** 00:06**
H.264 母版,1080p 00:07 00:06** 00:06**
FX、H.264 1080p 00:27 00:13 00:07
FX、H.264 5k 不适用* 01:03 00:38

*980Ti (GM200) NVENC 不支持大于 4096×4096 的分辨率,即使在 H.265 中,因此母版以 UHD (3840×2160) 渲染,因此将其纳入结果。由于这个原因,全分辨率 FX 被跳过。

** 可能是存储瓶颈,即使在 10GbE 上也是如此。

如果您发现自己经常使用 8K RED 素材,那么 96GB 的显存对于保持稳定的工作流程和在 Resolve 中保持合理的播放速度至关重要。即使在 5K 时,双 GPU 在性能上也有明显优势。CinemaDNG 结果虽然在 P920 上更快,但可能会从更快的存储中受益更多。在最繁重的测试中,我们从 NAS 中提取了超过 900MB/s 的速度,导致存储成为瓶颈,而 GPU 使用率在 HWinfo64 中仅占 48%。一旦我们投入 FX,我们就开始真正让 GPU 发挥作用,并且可以看到 P920 双 GPU 设置的优势以及 Resolve 可以如何有效地利用它们。

结论

Lenovo ThinkStation P920 确实是一台机器的野兽,但更重要的是,它是适用于许多不同应用程序和工作流程的出色平台。该工作站的高度可配置性允许满足任何需求的多种不同规格。此外,如果您的工作需求发生变化,其模块化构建允许轻松升级和重新配置。无论您是 VFX 艺术家、CAD 设计师,还是从事 AI 和机器学习或地质模拟,都有适合您的配置。Lenovo 提供我们测试过的配置作为现成的解决方案,但它们也可按订单定制以满足您的特定需求。

【公司名称】四川旭辉星创科技有限公司

【代理级别】成都联想服务器工作站总代理

【销售经理】李经理

【联系方式】座机:028-85596747    手机:13438344046

【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913

售前优惠咨询专线

13438344046(手机) 13438344046(手机) 028-85596747(销售专线)

售后保修咨询专线

028-85596747

在线咨询

售前咨询

请用微信扫描二维码

3.828662s