过去几年5G和人工智能(英语:Artificial Intelligence,缩写为AI)的火爆,不但带动了应用端、算法和相关ASIC芯片的繁荣,在服务器端也在推动创新。
这一方面是因为AI产生的海量数据需要服务器提供更多的运算能力支持,另一方面5G带来的应用场景需要服务器做相应的转变。而浪潮作为国内首屈一指的服务器供应商,正在引领并推动这场变革。
在日前主题为“智慧凝聚”的浪潮云数据中心合作伙伴大会(IPF)上,这家走在最前线的大厂给我们分享了他们对于AI和服务器现在和未来发展的一些看法。
全球服务器市场第三,AI服务器头号领头羊
在IPF 2018上,浪潮提出了做服务器全球第一的目标。虽然这是一个艰难的目标,但我们可以看到,浪潮服务器在2018年实现了84.4%的增长率,是全球服务器增长率的2.5倍。而在全球前三的服务器厂商中,排名第三的浪潮更是唯一一家2018年服务器出货量同比2017年有增长的企业。在国内,浪潮则是毫无争议的服务器领头羊,其31%的份额遥遥领先于其他厂商。
至于AI服务器方面,浪潮更是当之无愧的大赢家。资料显示,这个业务51.4%的国内市场都被浪潮承包了。公司也凭借在AI服务器的提早布局,迅猛发展为全球领先的AI服务器供应商。
中国工程院院士、浪潮集团执行总裁王恩东先生
按照中国工程院院士、浪潮集团执行总裁王恩东的说法,这主要通过他们发布的领先产品和众多伙伴合作实现的。王恩东指出,浪潮建立了人工智能全栈的生态、多样化的人工智能加速卡、超过20款的人工智能服务器、成熟的人工智能开发PaaS平台以及强大的人工智能框架优化能力。
同时,浪潮在人工智能生态上也进行了巨大投入,这就帮助他们在这个产业里建立起了广泛的合作。
据王恩东介绍,浪潮在2018年与合作伙伴推出了400多个联合解决方案,销售额达到了200多个亿。而公司现在已经有了9000多家不同行业的合作伙伴,合作伙伴与他们的合作业绩整体增长率也达到了惊人的116%。至于人工智能方面,浪潮2018年与合作伙伴一起针对人工智能的行业应用场景,整理出了20多个解决方案,积累了大量的经验和行业案例。
“当前在AI百强企业当中,80%的企业都是浪潮的伙伴,并且都是深度的合作伙伴,这里面既包括BAT互联网厂商,也包括第四范式等AI新兴的独角兽”,王恩东强调。
发布“元脑”,打造最强AI服务器生态
即使浪潮已经为AI服务器市场准备了不少“弹药”,但正如浪潮集团副总裁彭震先生所说,AI正在加速向通信、金融、广电、医疗和制造行业蔓延,这就需要更多的计算力。
在他看来,智慧计算是我们每个人都必须深刻思考的转型的方向。这也是为何浪潮会做出以硬件重构加软件定义去支撑云的发展;以大数据为认知方法为整个智慧计算提供转型的支撑;同时借助深度学习优化算法为其智慧计算提供业务变革的驱动力等决定的原因。
浪潮集团副总裁彭震先生
基于这样的思考,浪潮在IPF 2019上发布了他们的“元脑”平台等多样产品,助力人工智能产业腾飞。
据介绍,浪潮“元脑”是浪潮人工智能全栈能力的载体与具象,既包含浪潮全球领先的场景化人工智能基础设施,多样化的深度学习框架与工具,以及最新研发的人工智能 PaaS平台和AutoML Suite等“有形”产品,同时也凝聚了浪潮多年积累的人工智能算法优化、系统优化服务等“无形”能力。所谓“元”,寓意着一切的初始,同时神经元也是脑神经网络的基本要素。按照浪潮的规划,“元脑”将为人工智能提供最基础、最本源的创新支撑,赋能生态合作伙伴,加速产业人工智能化进程,促进人工智能产业百花齐放。
我们来看一下浪潮元脑系统组成。
超强AI计算系统:通过浪潮人工智能计算平台、人工智能超高速计算加速卡、极低延迟RDMA网络与超高带宽并行存储,共同提供极致人工智能计算性能。
敏捷AI PaaS平台:由极致优化的AI资源平台、极速流程化AI开发平台、开放兼容的AI生态平台和秒速构建AI软件栈。
最新开发的人工智能PaaS平台AIStation面向人工智能企业训练场景,可实现容器化部署、可视化开发、集中化管理等,有效打通开发环境、计算资源与数据资源,提升开发效率。
高效的AutoML Suite:最新开发的AutoML Suite可实现非专业人员亦能通过极少操作构建网络模型并获得高精度,极大降低了人工智能开发、应用的门槛和成本。在2018年的NeurIPS的自动机器学习挑战赛中,浪潮与北京邮电大学、中南大学团队合作,获得自动机器学习领域的国际顶尖赛事的全球第三佳绩。
整合一体化交付:计算/存储/网络一体化、内置AI PaaS平台、内置建模优化工具、预配置系统调优。
其他如F10A、F37X和人工智能计算加速引擎TF2,这是他们AI加速卡硬件的代表作。这些软硬件将为相关开发者提供强而有力的支持。
携手英特尔,推动传统服务器升级
除了AI服务器及其相关生态产品,传统的服务器也是浪潮未来持续关注的一个领域。但浪潮集团副总裁彭震同样指出,随着数据中心规模的变大,他们会面临构建和管理等一系列问题,这样给服务器带来了新挑战。
为了解决相关问题,浪潮与Intel共同发布了首款面向云计算场景优化的高密度四路服务器全球参考设计Crane Mountain(NF8260M5),目前已贡献给OCP社区,该参考标准将被更多服务器厂商借鉴。这款产品将单个2U平台核的数量增加至112个,48个内存插槽,提供了更高的部署密度、更低的整体成本,还可以承担数据库等传统应用,让公有云更适合承载传统企业应用和混合云的环境。
“这样一个高密度的设计,能更好地实现高效管理并降低OPEX 。预计整套系统的CAPEX可以节省7%~12%,这就意味着OPEX可以节省5%~7%,这样就能比较显著地降低数据中心的总体成本”,彭震强调。
这是一个为虚拟机优化的设计,可以支持很大的内存容量。同时为了提高系统的散热能效比,降低OPEX,他们还特意把这个产品的CPU的位置设计得有一些错位。这个系统的前面板可以支持可热插拔的模块,从而提供灵活的配置,可以方便售后的运维,也降低OPEX。
对人工智能计算未来的一些看法
王恩东在IPF 2019峰会上一再强调,计算力是现代社会的生产力,而人工智能则将是这种计算力的核心。但随着终端和上游应用的变化,人工智能计算如何才能满足客户、满足市场、能更好地为客户提供计算力支撑就成为了产业界关注的重点问题。王恩东则表示:“基于浪潮在AI方面的技术、产品、模式上的探索和实践,我们认为要达到这个目标,要做到开放、融合与敏捷这三点。”
首先看开放。
从浪潮集团副总裁胡雷钧先生的介绍中我们得知,所谓开放就包括了架构开放和平台开放,通过架构开放和平台开放,就能为他们的最终客户和合作伙伴提供一个良好的技术平台。“浪潮在过去的10年里面一直践行开放”, 胡雷钧强调。按照他的说法,浪潮已经逐渐从软件开放走向了硬件开放。
浪潮集团副总裁胡雷钧先生
在软件领域的开放方面,浪潮是OpenStack的全球黄金会员,他们在OpenStack社区贡献的代码可以帮助OpenStack实现1千个物理机以上的扩展,管理虚拟机的规模单一集群可以达到1万个;在存储领域,浪潮也和开源社区充分合作,能够为Ceph的性能提升提供巨大支撑,在有些场景里面可以实现I/O吞吐量的翻倍,实现了IOPS的十倍的提升;至于人工智能领域,浪潮的OpenCL FPGA第一次把多节点并行引入到了训练领域,这个开创性的成果也获得了整个社区的广泛接受。
来到硬件领域的开放,其整机柜服务器开放的项目是过去几年里面硬件开源领域里最成功的实践。胡雷钧告诉记者,基于浪潮和国内互联网公司合作的开放组织ODCC,他们搭建了整机柜交付的服务器系统,能够集中供电、集中管理、整机柜交付,为客户提供非常好的价值。又因为这里包含了2倍部署密度提升、10倍交付速度,实现了更高的维护效率、更高的投资收益和增长速度。这就让它能为多个不同的行业提供部署和应用。同时,浪潮也广泛参与了OCP、ODCC、Open19等开放组织。
其次看融合。
胡雷钧指出,融合主要体现在几个方面,第一个就是产业链的融合。他指出,浪潮原来的IT系统建设模式往往是基于标准产品、基于标准服务、基于用户和供应商之间比较清晰的界面,这个界面往往是以需求的方式表达的,但这个模式对于变化的适应就不是那么容易。
然而在融合的开发模式下,会让浪潮的前台/后台、最终客户和合作伙伴甚至厂商在一个开发平台上,在开源代码上、硬件上做共同的联合设计。
融合的另外一个方面也非常重要,就是要把新技术、把颠覆性的新技术融合到浪潮的业务模式设计里面,融合到整个的流程里面,融合到IT系统的支撑里面。通过这个融合,释放浪潮自己的创新能力,让创新为整个产业升级,改善整个产业的成本,为客户的应用体验的改善而提供支撑。
再看敏捷。
所谓敏捷包含两个层面,一个业务的敏捷,另一个是开发上的敏捷。
“我们现在在互联网模式的驱动下做的很多生意,都要依靠我们对客户服务的多样性,要依靠我们产品的多样性,要依靠对于市场的不断适应。这就要求我们自己的业务不断变化,不断前进。尤其是在AI推动的环境之下,会创新出很多新的应用模式和商业模式,这是很难规划的,就需要敏捷对待”。胡雷钧如是说。
在多维布局下,浪潮为走向服务器全球第一夯实了基础。