服务器

服务器

人工智能与深度学习-NVIDIA TITAN-V

人工智能训练

从语音识别到训练虚拟个人助理和教会自动驾驶汽车自动驾驶,数据科学家们正利用人工智能解决日益复杂的挑战。解决此类问题需要花大量时间密集训练复杂性飞速增长的深度学习模型。

Tesla V100 拥有 640 Tensor 内核,是世界上第一个突破100 万亿次 (TFLOPS) 深度学习性能障碍的 GPU。新一代 NVIDIA NVLink以高达 300 GB/s 的速度连接多个 V100 GPU,在全球打造出功能极其强大的计算服务器。现在,在之前的系统中需要消耗数周计算资源的人工智能模型在几天内就可以完成训练。随着训练时间的大幅缩短,人工智能现在可以解决各类新型问题。


产品详情

人工智能推理

为了利用最相关的信息、服务和产品加强人与人之间的联系,超大规模计算公司已经开始采用人工智能。然而,及时满足用户需求是一项困难的挑战。例如,全球最大的超大规模计算公司最近估计,如果每个用户一天仅花费三分钟时间使用其语音识别服务,他们便需要将数据中心的容量翻倍。

我们设计 Tesla V100 就是为了在现有的超大规模服务器机架上提供更高的性能。由于将人工智能作为核心,Tesla V100 GPU 可提供比 CPU 服务器高 30 倍的推理性能。这种吞吐量和效率的大幅提升将使人工智能服务的扩展变成现实。


人工智能的核心

人工智能并非由任何一个行业定义。它存在于超级计算、医疗保健、金融服务、大数据分析和游戏等领域中。由于每个企业都需要智能,因此人工智能是各行各业和市场的未来发展趋势,而人工智能的引擎就是 NVIDIA GPU 计算平台。

NVIDIA Volta 是人工智能的新驱动力。Volta 将推动各行各业取得突破性发展。这个引领下一代人工智能技术的架构还有助于实现堪比人类登月的壮举,例如根除癌症、智能化客户体验和研制出自动驾驶汽车。

 

突破性的创新

Tensor Core640 TENSOR 内核,巨大的性能飞跃

各行各业都需要人工智能。计算速度大幅提升的 Volta 让人工智能现在可以应用到各行各业中。Volta 配备 640 Tensor 内核,可提供每秒超过 100 万亿次 (TFLOPS) 的深度学习性能,是上一代 NVIDIA Pascal架构的 5 倍以上。

 

新型 GPU 架构

专为现代计算机而设计

人类最重大的挑战需要功能最强大的计算引擎来为计算机科学和数据科学服务。Volta 包含超过 210 亿个晶体管,是 NVIDIA 当前功能最强大的 GPU 架构。它将 NVIDIA® CUDA® 内核和 Tensor 内核搭配使用,在 GPU 中提供人工智能超级计算机的性能。

 

新一代 NVLINK

可灵活扩展以快速解决问题

Volta 采用新一代革命性的 NVIDIANVLink高速互联技术。与上一代 NVLink 相比,它的吞吐量提升了 2 倍。这有助于开发出更先进的建模和数据并行方法,以增强可扩展性,从而实现超快的应用程序性能。

 

针对 VOLTA 优化的软件

GPU 加速的框架和应用程序

数据科学家们通常需要在模型精度和更长的运行时间之间做出权衡。借助于针对 Volta 优化的 CUDA NVIDIA 深度学习 SDK 库(例如 cuDNNNCCL TensorRT 等),行业内最重要的框架和应用程序可以轻松利用 Volta 的强大功能。这推动着数据科学家和研究人员比以前更快地取得发现成果。

 


TOP