T4 GPU
搜索、社交媒体和在线购物网站等互联网公司是T4的早期使用者,也是最大的终端客户群。中国首批开始使用T4的企业包括百度、腾讯、京东以及科大讯飞。计算机制造商也将推出一系列基于T4的服务器,如浪潮、联想、华为、曙光、浪潮商用机器和新华三等。此外,谷歌云宣布谷歌云平台客户可以使用T4。
NVIDIA T4 GPU服务器
T4基于NVIDIA Turing TM架构,采用多精度Turing Tensor Core和RT Core,与容器化软件堆栈相结合,性能得到很大提升。可满足公共云和企业云环境的需求,提高吞吐量、利用率和用户并发性,帮助客户高效应对用户及数据爆炸式增长的问题。
T4可支持4种不同精度等级的各类AI工作负载,FP32精度能够提供8.1 TFLOPS,FP16精度能够提供65 TFLOPS,INT8精度能够提供130 TOPS,INT4精度能够提供260 TOPS。针对AI推理工作负载,配备2个T4 GPU的单个服务器最多可取代54台CPU服务器。针对AI训练,配备2个T4的单个服务器可取代9台双套接字CPU服务器。
本文素材来自互联网