近日,NVIDIA发布NVIDIA A100 80GB GPU,这一创新产品将支持 NVIDIA HGX AI超级计算平台。该GPU内存比上一代提升一倍,能够为研究人员和工程师们空前的速度和性能,助力实现新一轮AI和科学技术突破。
全新A100采用HBM2e技术,可将A100 40GB GPU的高带宽内存增加一倍至80GB,每秒超过2TB的内存带宽。这使得数据可以快速传输到全球最快的数据中心GPU A100上,使研究人员能够更快地加速其应用,处理最大规模的模型和数据集。
NVIDIA应用深度学习研究副Bryan Catanzaro表示:“若想获得HPC和AI的最新研究成果,则需要构建最大的模型,而这需要比以往更大的内存容量和更高的带宽。A100 80GB GPU所的内存是六个月前推出的前代产品的两倍,突破了每秒2TB的限制,使研究人员可以应对全球科学及大数据方面最严峻的。”
用于NVIDIADGX TM A100和NVIDIA DGX Station TM A100的NVIDIA A100 80GB GPU也于今日发布,预计将于本季度发货。
领先的商源讯、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想、云达科技、超微预计将于2021年上半年,基于HGX A100集成底板的,该集成底板搭载4-8个A100 80GB GPU。
满足大流量数据工作负载需求
A100 80GB版本基于A100 40GB的多样化功能,成为需要大量数据存储空间的各类应用的理想选择。
DLRM等推荐模型为AI训练了涵盖数十亿用户和产品信息的海量表单。A100 80GB可实现高达3倍加速,使企业可以重新快速训练这些模型,从而更加精确的推荐。
凭借其多实例GPU(MIG)技术,A100可分割为多达7个GPU实例,每个实例具有10GB内存。该技术是一种安全的硬件隔离方法,在处理各类较小的工作负载时,可实现GPU最佳利用率。对于如RNN-T等自动语言识别模型的AI推理,单个A100 80GB MIG实例可处理更大规模的批量数据,将生产中的推理吞吐量提高1.25倍。
在TB级零售大数据分析基准上,A100 80GB将其性能提高了2倍,使其成为可对最大规模数据集进行快速分析的理想平台。随着数据的动态,企业可以实时做出关键决策。
对于科学应用,A100 80GB可为天气预报和量子化学等领域巨大的加速。材料模拟软件Quantum Espresso采用单节点A100 80GB实现了近2倍的吞吐量提升。
RIKEN计算科学中心负责人Satoshi Matsuoka表示:“快速、充足的内存带宽和容量对实现高性能超级计算应用来说至关重要。具有80GB HBM2e GPU内存的NVIDIA A1002TB/s的全球最快带宽,可帮助我们大幅提高应用性能。”
A100 80GB的关键特性
A100 80GB具备NVIDIA Ampere架构突破性特性:
第三代Tensor Core核心:通过全新TF32,将上一代Volta架构的AI吞吐量提高多达20倍。通过FP64,将HPC性能提高多达2.5倍。通过 INT8,将AI推理性能提高多达20倍,并且支持BF16数据格式。
更大、更快的HBM2e GPU内存:使内存容量增加一倍,在业内率先实现2TB/s以上的内存带宽。
MIG技术:将单个独立实例的内存增加一倍,可最多七个MIG,每个实例具备10GB内存。
结构化稀疏:将推理稀疏模型的速度提高2倍。
第三代NVLink和NVSwitch ,相较于上一代互连技术,可使GPU之间的带宽增加至原来的两倍,将数据密集型工作负载的GPU数据传输速度提高至每秒600 gigabytes。
NVIDIA HGX AI 超级计算平台
A100 80GB GPU是NVIDIA HGX AI超级计算平台的关键组件。该平台将NVIDIA GPU、 NVIDIA NVLink®、NVIDIA InfiniBand网络以及全面优化的NVIDIA AI和HPC软件堆栈的全部功能整合在一起,以最优越的应用性能。该平台使研究人员和科学家能够将HPC、数据分析和深度学习计算技术结合起来,共同推动科学进步。
惊喜来袭
AI行业盛会GTC 中国站注册火热进行中。
大会期间,所有注册参会者可通过登陆, 定制个人参会日程、设置参会提醒、查看积分并兑换,换取电商购物券、拉杆箱、NVIDIA Jetson Nano 等好礼。观看主题演讲还将有机会赢得 GeForce RTX 3070 显卡!所有福利仅限注册用户。
本文相关词条概念解析:
内存
内存是计算机中重要的部件之一,它是与CPU进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。内存(Memory)也被称为内存储器,其作用是用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。只要计算机在运行中,CPU就会把需要运算的数据调到内存中进行运算,当运算完成后CPU再将结果传送出来,内存的运行也决定了计算机的稳定运行。内存是由内存芯片、电路板、金手指等部分组成的。
标签:Everalbum已与美国联邦贸易委员会(Federal Trade Commission, FTC)达成协议。此前,该公司被指控在其Ever云照片存储应用程序使用面部识别技术、以及保留已注销账户用户...
2021-01-19 阅读全文>>在PD-1利润空间收窄的情况下,如何突围,将考验每家药企的智慧 视觉中国图近日,百济神州中国区总经理兼公司吴晓滨对第一财经记者表示:“中国虽然经济发展得很快,但从人均GDP比较,在世界排名仍靠后。中国...
2021-01-18 阅读全文>>物理学家在玻璃的固液转变研究中发现了一种全新的物质状态,他们称这种介于固态和液态(如凝胶)之间的新物质状态为“液态玻璃”研究人员通过化学方法合成了球状的聚合物核壳胶体粒子,并用不同的荧光基团染色。之后...
2021-01-19 阅读全文>>什么是表面处理表面处理是利用物理学、化学、材料学和制造学等多学科的边缘性新技术,来改变零部件表面的状况和性质的一种工艺。表面处理应用于各个领域,例如人类生产用的工业用品、生活用的日常用品、消费品、工艺...
2021-01-19 阅读全文>>据美国宇航局NASA报道,一支国际天文小组在宇宙中发现一个奇怪现象—大约每隔114天,一个遥远星系中心就会上演一次大爆发,在多个波段产生明亮耀斑。这个引人注目的星系名为ESO 253-3,距离我们约5...
2021-01-19 阅读全文>>科技创新2030—“脑科学与类脑研究”重大项目2020年度项目申报指南征求意见稿为进一步提升我国脑科学与类脑研究领域的研究水平,依据科技创新2030—“脑科学与类脑研究”重大项目实施方案,现提出脑科学...
2021-01-19 阅读全文>>HS-TGA-101热重分析(TGA)是以恒定速度加热试样,同时连续地测定试样失重的一种动态方法。此外,也可在恒定温度下,将失重作为时间的函数进行测定。应用TGA可以研究各种气氛下高聚物的热稳定性和热...
2021-01-18 阅读全文>>基因是当今最受瞩目的医学和生物技术之一。它可以在活体基因组的特定位置插入、删除、修改或替换一段DNA片段,被认为是可以解决诸多疑难病症的“终极方法”2020年诺贝尔化学奖就颁给了基因技术的两位先驱。最...
2021-01-19 阅读全文>>量子就像是烹饪时放的万能咖喱酱,只要往里一加,科幻味就来了。穿越时空太老土,加个量子纠缠就变得先进而前卫;纳米颗粒听腻了,改名叫量子粒子听起来就高深莫测。一时间仿佛说不清道不明的事情,只要加个量子前缀...
2021-01-18 阅读全文>>文/陈根不论是马斯克“脑机接口”BCI技术的重大突破,包括其设备获得FDA“突破性设备计划”许可的,还是全球范围内以Neuralink、Mind Maze、Neuro Pace、BrainCo等为代表...
2021-01-19 阅读全文>>