x265 工作负载简介
一种用于编码视频流的开源软件库和应用程序。
Ampere® Altra® 和 Ampere® Altra® Max 处理器是为云原生应用构建的完整片上系统 (SOC) 解决方案。 Ampere Altra Max 最多支持 128 个内核。 除了提供大量高性能内核外,其创新架构还提供可预测的高性能、线性扩展和电源效率。
在线视频市场持续快速增长,推动了视频转码压缩的应用,这样可以大大减少存储空间和网络带宽。Ampere Altra Max提供行业领先的性能和能效,非常适合用于 x265 的视频转码。
Ampere Altra Max 旨在为视频编码等应用提供卓越的性能和能效。我们使用 x265,它实现了 H.265/MPEG-H Part2 标准,这是当今仅次于 H.2641,2 的第二广泛使用的视频编解码器。此前,我们曾报道过在 Ampere Altra Max 3,4 上运行 x264 的行业领先性能和能效。与 x264 相比,更高级的视频编解码器(如 x265)提供更大的视频压缩,同时也需要更大的计算资源和功耗。
Ampere Altra Max 采用创新的架构设计,以一致的频率与单线程内核运行,使应用程序更能抵抗“相邻干扰”问题,保证工作负载以可预测的方式或最小的差异下运行,同时有非常出众的能效表现。最近针对 aarch64 架构的 x265 性能优化有了显著提升。在出色的硬件平台上运行优化的x265软件赋予了 Ampere Altra Max 领先的性能和能效,高性能与低功耗兼得。
云原生:Ampere Altra Max 专为云原生应用用户而设计,Ampere Altra Max 处理器非常适合使用 x265 等应用在云中进行视频编码。
可扩展性:凭借创新的横向扩展架构,Ampere Altra Max 处理器具有高内核数和令人称叹的单线程性能,以及所有内核的一致频率,可在插槽级别提供更高的性能。
能效:行业领先的能效使 Ampere Altra Max 处理器的原始性能达到具有竞争力的水平,同时消耗比竞争对手低得多的功率。
内存
外部连接
系统
性能
我们评估了 Ampere Altra Max M128-30 处理器与 Intel® Xeon® Platinum 8380(Ice Lake)和 AMD EPYC™ 7763(Milan)的 x265 性能。我们使用带有 4.18 内核的 CentOS 8.4,使用多个 x265 预设条件(中等、较慢、非常慢和安慰剂)和具有不同分辨率(480、720 和 1080)的视频输入来运行测试。为了最大限度地提高平台吞吐量,运行多个 x265 实例,数量等于插槽上可用的 CPU 内核数,每个实例使用一个线程。为了最大限度地减少操作系统开销,x265 二进制文件、输入和输出文件存储在 RAM 磁盘上。我们在所有平台上使用 gcc 11.2 构建了最新可用版本的 x265,[此处] https://bitbucket.org/multicoreware/x265_git)下载。有关其他详细信息,请参阅下面的其他基准测试详细信息描述。
与 Intel® Xeon® Platinum 8380 (Ice Lake) 和 AMD EPYC™ 7763 (Milan) 相比,Ampere Altra Max 运行 x265 的性能最高。 图 1 显示,取 3 个不同输入视频中的性能平均值,对测试的所有 x265用例,Ampere Altra Max 始终比 x86 平台更快。 我们可以看到与 Intel® Xeon® Platinum 8380(Ice Lake)相比,Ampere Altra Max 的平均编码速度提高了 2.0 至 2.5 倍,与 AMD EPYC™ 7763(Milan)相比,Ampere Altra Max 的平均编码速度提高了 1.1 至 1.3 倍。
在图 2 中,我们绘制了聚合 FPS 与同时运行的 x265 实例的数量。Ampere Altra Max 展示了出色的平台扩展能力,从 1 到 128 个内核呈线性扩展,突出了 Ampere Altra Max 创新的横向扩展架构。Intel® Xeon® Platinum 8380 处理器(Ice Lake),40 个物理核心,AMD EPYC™ 7763(Milan),64 个物理核心,整体性能较低,使用超线程运行时,扩展性差,此特征非常明显。
除了最佳的视频编码性能外,Ampere Altra Max 还是最节能的处理器,可减少视频编码的碳足迹。 图 3 显示了 Ampere Altra Max 在插槽级别的平均功耗,其功耗是Intel® Xeon® Platinum 8380 处理器(Ice Lake)的 0.79%-0.81%,是 AMD EPYC™ 7763(Milan)的 0.79%-0.80%。
凭借行业领先的性能和能效,Ampere Altra Max 可提供出色的每瓦性能。 图 4 显示了 FPS/Watt(相当于帧/焦耳),与 Intel® Xeon® Platinum 8380 处理器(Ice Lake)相比,Ampere Altra Max 的 FPS/Watt 提高了 2.5 – 3.1 倍,相比AMD EPYC(霄龙)7763(Milan)FPS/Watt 提高了 1.4 – 1.7 倍。
Ampere Altra Max 处理器是一个完整的片上系统 (SOC) 解决方案,专为云原生工作负载而构建,旨在为使用 x265 的视频编码等应用程序提供卓越的性能、更大可扩展性和更高能效。 h.265 压缩标准是当今使用第二广泛的视频格式,仅次于 h.264,x265 是 h.265 的主要实现。我们之前展示了 Ampere Altra Max 在运行 x2643,4 时提供了行业领先的性能和能效。 在这里,我们展示了 Ampere Altra Max 在运行 x265 时提供了行业领先的性能和能效。更高级的视频编解码器(例如 x265)需要更大的计算资源和功耗提供更大的视频压缩,非常适合在高性能低功耗的Ampere Altra Max 处理器上运行。
与Intel® Xeon® Platinum 8380 处理器(Ice Lake)相比,Ampere Altra Max 的编码性能提高了 2.5 倍,能源效率提高了 1.2–1.3 倍,FPS/Watt(相当于焦耳/帧)提高了 3.1 倍。与 AMD EPYC™ 7763(Milan)相比,Ampere Altra Max 的速度提高了 1.35 倍,能源效率提高了 1.2-1.3 倍,FPS/Watt 提高了 1.7 倍(相当于焦耳/帧)。除了提供最快的视频编码之外,Ampere Altra Max 还提供可预测的高性能,可从 1 到 128 个内核线性扩展,其高能效的设计能显著减少视频编码计算所产生的碳足迹,以最高性能水平完成 x265 进行编码,同时不影响能源效率。