谷歌云上的 x264 工作负载简介
基于 Ampere Altra 处理器的 TAU T2A 虚拟机
Ampere® Altra®处理器从设计伊始就旨在为云原生应用程序(如视频编码)提供卓越的性能。以其创新架构,提供高性能、线性可扩展性和惊人的能源效率,Ampere Altra允许工作负载在不断增加的负载下,性能变化很小,以可预测的方式运行。为视频编码这样的实际云工作负载中提供行业领先的性能/瓦特能力和更低的碳足迹。
谷歌云基于Ampere Altra处理器的Tau T2A虚拟机针对向外扩展的云原生工作负载进行了成本优化,提供以多种预定的虚拟机形态-每个虚拟机最多48个vCPU,每个vCPU 4 GB内存,最高32 Gbps网络带宽,以及广泛的网络连接存储选项。这些虚拟机适用于诸多向外扩展的工作负载,如web服务器、容器化微服务、数据日志处理、媒体转码和Java应用程序。
我们使用libx264实现了H.264/MPEG-4 AVC标准,这是目前使用最广泛的标准。“vbench:云视频转码基准,新兴视频即服务工作负载的基准”,可在http://arcade.cs.columbia.edu/vbench上获得,用于评估x264性能。根据这篇论文,vBench中的15个输入视频是通过算法选择的,综合了分辨率、帧速率和复杂性等因素,可以代表一个数百万个视频的大型商业资料库。
由Ampere Altra处理器驱动的谷歌Cloud Tau T2A虚拟机在各种视频编码工作负载(包括运行vbench的x264)中提供了出色的性能。我们使用vbench的上传配置来评估x264性能,它使用单次转码而不降低输入视频质量,代表了为初次上传到视频服务所做的编码,它即要求速度也要求较好的视频质量。我们使用GNU并行实用程序运行vbench,同时运行8个作业,每个作业都有8个线程,使用系统安装的ffmpeg版本对vbench的15个输入视频进行转码。
基于Ampere Altra的谷歌Cloud Tau T2A虚拟机的原始性能优于x86虚拟机。对于vbench上传配置,T2A虚拟机比N2虚拟机性能提高8%,比N2D虚拟机性能提高5%。
如果比较性价比,T2A虚拟机比传统x86虚拟机更好。对于vbench上传配置,Altra T2A虚拟机的性价比比N2虚拟机高36%,比N2D虚拟机高15%。
N2 Standard 8 | N2D Standard 8 | T2A Standard 8 | |
---|---|---|---|
Number of vCPUs | 8 | 8 | 8 |
Hourly cost | $0.388472 | $0.337968 | $0.308 |
Operating System | Debian GNU/Linux 11 (bullseye) | Debian GNU/Linux 11 (bullseye) | Debian GNU/Linux 11 (bullseye) |
Kernel version | 5.10.0-17-cloud-amd64 | 5.10.0-17-cloud-amd64 | 5.18.0-0.deb11.3-cloud-arm64 |
ffmpeg version | 4.3.4-0+deb11u1 | 4.3.4-0+deb11u1 | 4.3.4-0+deb11u1 |
264 - core 160 r3011 cde9a93 | 264 - core 160 r3011 cde9a93 | 264 - core 160 r3011 cde9a93 | |
Memory | 32GB | 32GB | 32GB |
Disk | 10GB NVME | 10GB NVME | 10GB NVME |
gcc version | 10.2.1 | 10.2.1 | 10.2.1 |
我们使用了Andrea Lottarini、Alex Ramirez、Joel Coburn、Martha a. Kim Parthasarathy Ranganathan、Daniel Stodolsky和Mark Wachsler(2018)中“vbench:云中的视频转码基准,新兴的视频即服务工作负载的测试基准”中指定的vbench配置。
每个vbench输入文件都采用GNU并行处理,命令如下:
parallel -j8 /usr/bin/ffmpeg -threads 8 -y -i {} -c:v libx264 -preset medium -crf 18 {.}.out.mkv '</dev/null >&/dev/null ::: input/*.mkv
视频编码在云中是一种流行的工作负载,考虑到目前可用的无数格式、目标设备和分辨率,这是一项计算密集型任务。H.264仍然是市场上最流行的视频编解码器。在我们的测试中,与传统的x86虚拟机相比,由Ampere Altra 云原生处理器驱动的谷歌Cloud Tau T2A虚拟机提供了更好的性能和性价比——使用流行的vbench视频即服务基准,性能提高了8%,性价比提高了36%。
有关使用Ampere Altra处理器的谷歌Tau T2D虚拟机的更多信息,请访问谷歌云博客。
此处包含的所有数据和信息仅供参考,Ampere 保留更改它的权利,恕不另行通知。本文档可能包含技术错误、遗漏和印刷错误,Ampere 没有义务更新或更正此信息。 Ampere 不作任何形式的陈述或保证,包括但不限于对不侵权、适销性或适用于特定目的的明示或暗示保证,并且不承担任何形式的责任。所有信息均“按原样”提供。本文件不是 Ampere 的要约或具有约束力的承诺。使用此处设想的产品需要随后的谈判和最终协议的执行,或者受 Ampere 的商品销售条款和条件的约束。
与 Ampere 测试中使用的不同的系统配置、组件、软件版本和测试环境可能会导致与 Ampere 获得的测量结果不同。
©2022 Ampere Computing 版权所有。Ampere、Ampere Computing、Altra和“A”标志均为Ampere Computing的注册商标或商标。Arm是Arm有限公司(或其子公司)的注册商标。本出版物中使用的所有其他产品名称仅用于识别目的,可能是其各自公司的商标。
Ampere Computing®/ 4655 Great America Parkway, Suite 601 / Santa Clara, CA 95054 / amperecomputing.com