金山云新一代GPU云服务器上线基于TeslaT4性能提升350%

近日，金山云基于Tesla T4的GPU云服务器正式对外商用，这也是继去年国内首家商用Tesla V100之后，金山云在GPU云服务器领域再一次拔得头筹，代表金山云在新技术应用上始终处于行业领先水平。

创新互联建站专注为客户提供全方位的互联网综合服务，包含不限于成都网站设计、成都网站制作、解放网络推广、重庆小程序开发、解放网络营销、解放企业策划、解放品牌公关、搜索引擎seo、人物专访、企业宣传片、企业代运营等，从售前售中售后，我们都将竭诚为您服务，您的肯定，是我们大的嘉奖；创新互联建站为所有大学生创业者提供解放建站搭建服务，24小时服务热线：13518219792，官方网址：www.cdcxhl.com

作为全面升级的新一代GPU云服务器，T4采用了最新的Turing架构，单卡提供8.1 TFLOPS的单精浮点计算能力和65 TFLOPS的混合精度(FP16/FP32)矩阵计算能力。Tesla T4相比于上一代产品Tesla P4，其整体性能有了较大的提升，在给定场景下，T4的推理性能提升超过350%。

震撼的多精度推理性能为AI全面加速

Tesla T4基于Turing架构，提供了更加强大的训练和推理能力，在原有对FP32和FP16支持的基础上，Turing架构中的Tensor Core新增了对INT8和INT4的支持，并探索性地推出了INT1精度模式。通过对多种精度模式的支持，T4能够有效缩短在线预测和离线训练时长。根据Nvidia公布的测试数据，在语言推理的场景中(NLP: GNMT Model)，T4相对于P4，其性能提升超过350%。

Tesla T4使用TU104核心，搭载136亿个晶体管，共40个SM(stream multiprocessor)，每个SM单元中有64个CUDA Core和8个混合精度的矩阵运算单元Tensor Core，共2560个CUDA core和320个Tensor core，提供8.1 TFLOPS的单精度性能和65 TFLOPS的混合精度(FP16/FP32)性能。此外，T4中还集成了Turing架构首次引入的RT Core，可实现高效的光线追踪(Ray Tracing)功能，在图形图像渲染方面有着广泛的应用。目前，金山云基于T4的GPU加速计算服务已全面商用，为诸多客户提供着高性能的计算支撑。

优异的机器学习能力让技术更智能

T4针对深度学习应用场景，进行了全方位的优化。首先，T4卡配备了320个Tensor Core。Tensor Core作为专门用于执行张量/矩阵运算的计算单元，能够为训练和推理场景中的矩阵运算提供极大的加速，被广泛用于各种深度学习的场景中。Turing Tensor Core相对于先前的Volta版，强化了推理的功能，支持了INT8和INT4两种精度模式，算力分别高达130TOPS和260TOPS。其次，T4继承了Volta架构中首次引入的Multi-Process Service(MPS)功能，优化了对batch较小时推理的性能，减少启动延迟，从而能够支持更多的并发请求。

及时响应是提升用户参与度的关键，随着模型准确性和复杂性的提高，快速交付正确答案所需的计算能力也在呈指数级提升。T4拥有先进的实时推理性能，在会话式人工智能、推荐系统和可视化搜索等场景的处理上，可提供低延时、高吞吐量的计算能力，进而实时满足更多的处理请求。T4通过优异的机器学习推理能力让技术应用更为智能。除了深度学习外，T4在视频转码和虚拟桌面等诸多场景中都能够发挥重要的作用。

作为中国领先的云计算服务提供商，金山云始终致力于通过最前沿的技术、最高效的产品为客户提供更加安全、稳定、便捷的云服务。目前基于T4的 GPU云服务器已经开放商用，卓越的深度学习推理性能，让用户能够更加快速、高效地构建AI业务，运行大规模模型推理应用。同时，基于Tesla T4的实例具备易扩展和高性价比的特性，能够为用户节省大量计算成本，有效提升AI产品迭代的速度，提高企业AI竞争力。

标题名称：金山云新一代GPU云服务器上线基于TeslaT4性能提升350%
标题路径：http://cxhlcq.com/article/dgijj.html

金山云新一代GPU云服务器上线基于TeslaT4性能提升350%

其他资讯

网站制作

企业服务

网站建设

服务器托管