9月17日,腾讯云宣布旗下弹性计算产品序列全面升级,全新推出的计算产品实例将以更强的算力性能,满足产业互联网时代各行各业不断提升的计算需求。在异构计算领域,腾讯云发布了包括搭载Xilinx 自适应计算加速平台 Alveo U200的FPGA实例FX4,以及采用 NVIDIA T4的GPU实例GN7在内的全新一代异构计算产品阵容,可以在未来相当时间内满足信息化以及人工智能等产业对异构计算指数级的需求增长。
腾讯云异构计算专家产品经理高平
异构计算新实例首发 满足不同场景需求
由于通用CPU已经无法满足人工智能各类应用中对高并发和高算力的需求,混合了不同架构计算单元的异构计算已经成为人工智能领域最高效的计算模式。与此同时,随着人工智能在各个行业的落地加速,不同行业,不同的业务场景对人工智能的要求也产生了分化。例如在电商,文创,教育,金融,游戏以及传统行业虽然都要大量使用到AI,但对异构计算的算力和部署模式需求都不尽相同。对云计算企业而言也提出了更高的要求。
腾讯云此次发布的两款异构计算新实例在保持方便快捷部署、计算能力强大、弹性可配置的基础上,进一步丰富了算力的粒度,能够充分满足不同行业用户和应用场景下对异构计算的不同需求。
Xilinx Alveo自适应计算加速平台
FPGA新实例云上瑞士军刀FX4因其可编程的特性,可以让用户定制的算法实现硬件加速,大幅提高效率,同时拥有更佳的能源效率。腾讯云是国内首家由 Xilinx 自适应计算加速平台 Alveo 支持的公有云,Xilinx Alveo U200能够为重要工作负载提供比CPU高90倍的性能,在不改变硬件的情况下,能加速任何工作负载,并能降低总体拥有成本。此外,FX4提供了创新的开发者模式,安全而且高效,能够提供类似于本地FPGA的开发体验。
GPU新实例GN7可以根据计算、渲染/游戏、桌面等场景的不同算力需求衍生出1/2 GPU、1/4 GPU等虚拟化实例规格,进而大幅提升GPU的利用率,帮助用户降低成本。
助力人工智能行业轻松拥有最强算力
腾讯云异构计算专家产品经理高平透露,经过2年的发展,腾讯云异构计算产品的用户规模增长超过10倍,并且得到了用户的广泛认可。
自2017年6月推出基于M40的GPU计算实例以来,目前腾讯云已经构建了完整的GPU计算实例矩阵,包括新发布的GN7以及GN6S、GN10X等,能够满足用户在深度学习训练/推理、视频转码、图形渲染、云游戏等多种场景下的不同算力需求。
对比行业,腾讯云的GPU计算实例矩阵在不同算力层次都有明显的显存优势,M40 GPU和P40 GPU标配24G显存,同时是国内唯一大规模提供V100 32G GPU的主流公有云。据悉,V100 32G是目前为止显存最大、算力最强的GPU,其已在腾讯云广泛部署,帮助用户随时获取最强算力。
传统的异构计算产品部署复杂、缺乏优化、并且需要相关人员有足够的技术经验,为此,腾讯云此次发布的两款异构计算新实例将
简化软件的安装部署过程,提供从简单到灵活之间的多种安装部署方式选择,让异构计算产品既简单,又好用。
对人工智能这样需要高性能计算的复杂应用来说,腾讯云异构计算产品在提供最强算力的同时,拥有更佳弹性的使用模式以及更高的性价比,大大降低了人工智能计算门槛。即便是人工智能初创企业,也能够轻松搭建属于自己的超算中心。
从深度学习到基因组学 腾讯云异构计算无处不在
目前,腾讯云异构计算产品拥有极其广泛的应用前景,适用于深度学习、图形渲染、云游戏等对计算能力、时延要求极高的场景,同时还能满足分子建模、基因组学等工程计算领域的高要求。
以曾被苹果App Store 评选为“年度优秀本土App”的“马卡龙玩图”为例,这款单体智能识别AI视觉制作APP对GPU算力有很高要求,在采用GN10X实例后,超大的32G显存能够帮助其低延迟处理多个模型,提升了用户体验。
目前GN7实例已经应用在腾迅云自有的智能钛弹性模型服务(TI-EMS)上,TI-EMS在线推理平台可以使用vGPU做小模型推理,充分提高了GPU的利用率,能够帮助用户在解决模型部署复杂、资源浪费、手工扩展资源效率低下等问题的同时,进一步的降低成本。
FPGA方面,腾讯云构建的FPGA云生态,可以提供一系列优秀的压缩、加解密、图片处理、视频编解码、基因算法加速等IP,应用方只需要专注在上层应用和服务开发上,而不需要再关注FPGA编码、调试等繁琐细节。以腾讯云此前与东南大学合作的科研项目为例,基于腾讯云提供的FPGA云计算服务,东南大学科研人员能够在一个开源的系统平台进行具有高附加值的教学和研究,缩短了使用者的开发时间,助力高效理论研究成果迅速转化。
另外一种异构计算类型ASIC+CPU,腾讯云目前也在持续关注。高平表示,未来腾讯云将打造GPU+FPGA+ASIC混合形态的异构计算产品阵列,并在集群与算力池化方面持续投入,打造适应未来的异构计算产品,为通用计算、云端渲染、视频处理等场景提供更强算力及更优的解决方案。
相关阅读:
本文素材来自互联网