谷歌表示,按照原始运算能力计算,这种设备可以跻身全球前五大超级计算机行列,但由于TPU的数值精度很低,所以在考虑这个数值时应该打个折扣。
但用户不必非要使用完整的TPU Pod,谷歌还允许开发者租赁其中的部分算力。但无论如何,这款设备都非常强大,最快可以在两分钟时间内训练一个使用ImageNet数据集的标准ResNet-50图片分类模型。
TPU v2 Pod最多配备512个核心,运算速度略慢于v3。例如,当使用265个TPU时,v2 Pod可以在11.3分钟内训练ResNet-50模型,v3Pod仅需7.1分钟。使用一个TPU花费的时间为302分钟。
本文素材来自互联网