查看原文
其他

FPGA加速驱动新时代的数据洪流,上篇

老石 老石谈芯 2020-12-18

(原文最早于2018年9月发表在老石的个人博客”老石谈芯“,可点击文末的“阅读全文”查看)


目 录

  1. 前言

  2. 英特尔“泛数据中心”业务

  3. 使用FPGA智能网卡加速数据中心网络

    3.1 数据中心网络市场高速增长

    3.2 FPGA智能网卡产品线发布

    3.3 针对网络功能虚拟化的FPGA智能网卡

  4. 小结


1

前言

2018年8月8日,英特尔在美国总部召开了名为“以数据为中心(Data-Centric)”的创新峰会。在会上,以英特尔执行副总裁、数据中心集团总经理Navin Shenoy为首的各产品线主要负责人介绍了英特尔在大数据时代的发展愿景和布局,对“以数据为中心的计算(Data-Centric Computing)”的潜在市场进行了分析,并且公布了若干英特尔相关软硬件产品的发展路线图。


本次峰会披露了很多关于FPGA的重大动态,其中包括正式宣布了基于英特尔FPGA的智能网卡产品线,以及其第一款代号为“Cascade Glacier(冰川瀑布)”的量产版智能网


作为这款产品的FPGA研发团队的主要成员之一,老石从立项之初就参与了它的各项研发工作,并负责了多个软硬件模块和系统的设计与验证任务。因此对于这款产品的正式对外发布,我倍感欣喜,并希望通过本文进一步梳理和分析峰会的技术细节,以及从以下几个方面探讨FPGA在大数据时代的各种机遇和挑战:

  1. 英特尔“泛数据中心”业务及其潜在市场

  2. 基于FPGA的智能网卡产品线的正式发布

  3. 英特尔人工智能计算加速器产品系列的相关布局

  4. FPGA开发的痛点与潜在方案


2

英特尔“泛数据中心”业务

近年来,英特尔一直积极的寻求业务转型,即从一家以个人计算机和CPU为主的企业,转向以数据为中心并围绕其发展全栈式解决方案的公司。


为了实现这一目标,这几年英特尔先后收购了FPGA大厂Altera(167.5亿美金),自动驾驶大厂Mobileye(153亿美金),人工智能芯片初创公司Nervana、机器视觉公司Movidus等众多公司扩展其产品线,并同时招揽了两位芯片设计大神Jim Keller(下图左)和 Raja Koduri(下图右)分别担任半导体工程总负责人和芯片总架构师,负责统领英特尔各类芯片,特别是高端数据中心芯片的整体架构和路线图规划。另外,英特尔旗下的风投部门仅在2017年就投资了包括地平线在内的十余家AI初创企业,各领域总投资额超过五亿美元。


推动这场变革的主要力量,就是目前方兴未艾的大数据浪潮。目前,全世界现有的超过90%的数据都是在过去的两年内产生的。随着人工智能、自动驾驶、5G、云计算等各种技术的不断发展,各类数据将会基于源源不断的产生,预计到2025年时,数据总量将比现在增长10倍。由于上述技术的发展都基于对大数据的研究和分析,因此有人形象的将数据比作未来人工智能时代的石油


随着数据量的增长和技术的发展,对数据进行处理的能力也有了长足的进步。特别是随着摩尔定律的延续,从2012年至2017年,处理数据所需的计算和存储成本分别下降了56%和77%;同时,处理数据的性能相较2006年则提升了41倍,如下图所示。


然而即便如此,现如今只有不到1%的数据被有效的进行了处理、分析和利用。由此可见,如何高效的以数据为中心进行现有系统的优化设计、升级和创新,拥有着巨大的市场潜力和前景。


在本次峰会上,英特尔对其2022年的大数据相关的潜在市场规模(Total Addressable Market – TAM)做了自己的预测,如下图所示:


英特尔的各类以数据为中心的业务部门主要包括四个子业务群:

  1. 传统的数据中心业务,包括Xeon处理器、网络、连接等;

  2. 非易失性存储业务,包括英特尔的SSD和NAND业务;

  3. 物联网和自动驾驶业务,包括各个专注于人工智能相关业务的部门;

  4. FPGA业务,包括FPGA在数据中心、AI、网络和自动驾驶等领域的应用。


为了方便描述,我在本文中将将其统一称作“泛数据中心”集团。至2022年,泛数据中心集团的潜在市场规模将超过2000亿美元,并由此成为英特尔历史上最大的市场机遇。其中,各个子业务群的市场规模分别为,传统数据中心业务超过900亿美元、非易失性存储业务750亿美元,物联网和自动驾驶业务330亿美元,FPGA相关的业务也超过80亿美元。


为此,英特尔提出了“全栈式”的数据中心系统解决方案路线图,并由此打造以数据为中心的基础架构,如下图所示。


为了构建以数据为中心的基础设施架构,必须在三个主要方面形成核心竞争力,分别是数据传输、数据存储和数据计算


其中,“更快”的数据传输使得海量数据能在最短的时间内得到处理,这主要是基于下一代光传输和以太网技术。“更多”的数据存储使得源源不断产生的数据能得到保存,并伴随着高速的读取和写入,这依赖于下一代SSD和内存技术的发展。“更广泛”的数据处理能够更智能的对各类数据进行计算处理,进一步提高数据的利用效率,这就需要更强大的通用数据处理器,如Xeon,并辅以各类硬件加速器,如FPGA等。


值得注意的是,FPGA被明显标注于图中的传输和计算两个部分,这足以显示FPGA在强力助推下一代数据中心基础设施“三驾马车”时的重要地位,以及英特尔对FPGA在其战略路线图中的重视程度。


3

使用FPGA智能网卡加速数据中心网络

3.1

数据中心网络市场高速增长

在2022年,FPGA的数据中心相关业务的潜在市场规模将达到80亿美元,较现在增长将超过30亿美元。就英特尔FPGA业务部(原Altera)而言,其数据中心相关业务的年同比增长率在今年一季度达到了140%,与高端FPGA器件相关的增幅达50%,而整体业务也有超过两位数的增长,见下图所示。


FPGA的一个最主要的应用领域就是对各类网络数据进行并行化处理。这里的网络,既包括传统的有线通信网络,也包括正在兴起的5G无线网络,以及在数据中心里的各类网络连接。


3.2

FPGA智能网卡产品线发布

前文中提到,作为本次峰会的一大亮点,英特尔发布了全新的基于FPGA的智能网卡产品线,以及其中的首款量产级产品,代号为“Cascade Glacier(冰川瀑布)”。由此进一步扩充了英特尔的以太网硬件产品线,形成了传统网卡(ASIC)+智能网卡(FPGA)+网络功能加速卡(FPGA)的完整产品组合,如下图所示。


这类智能网卡的产生背景是为了应对数据中心网络流量的爆炸性增长。从下图可以看到,全球数据中心的网络流量将从2016年的6.8Z字节(1ZB等于10的12次方GB)暴增至2021年的20.6Z字节,年复合增长率约为25%。值得注意的是,这其中大部分的网络流量都是在数据中心内部的,因此如何优化处理这类网络流量就成了亟需解决的课题。


另外,在目前的通信及云服务提供商的数据中心里,部分CPU核心被用来实现必须的存储和网络功能,如针对虚拟化交换的OVS(Open Virtual Switch),以及针对I/O虚拟化的Virtio等等,这样使得宝贵的CPU资源被非用户任务占用,造成可用CPU资源的压缩和紧张。为解决这些问题,Cascade Glacier智能网卡由此产生。


如下图所示,Cascade Glacier基于英特尔Arria10系列FPGA,能为云数据中心的网络流量提供2x25GbE的数据处理加速。


下图展示了如何使用FPGA智能网卡对原本运行在CPU上的网络功能进行卸载。与传统网卡以及现有的其他智能网卡相比,它提供了业界唯一的对Virtio协议的硬件支持和加速,使得云数据中心里的虚拟机可以进行无缝的动态迁移,而不需要安装额外的驱动,极大的扩展了数据中心的部署灵活性。它将原本在CPU上实现的OVS功能完全卸载到FPGA上实现,释放了宝贵的CPU资源。


另外,它还提供了FPGA灵活的可编程以及低功耗的特点,方便在数据中心中大规模部署,以及对常用网络功能进行定制化加速。


作为英特尔独立开发的量产级智能网卡产品,Cascade Glacier会与英特尔”泛数据中心“架构中的其他组成部分,如Xeon CPU、存储器、AI协处理器和加速器等,进行软硬件深度整合,从而提供完整的端到端的系统解决方案。


目前,Cascade Glacier已经进入了最后的批量装配阶段,并预计将于2019年一季度正式出货。


Cascade Glacier可以算是英特尔针对云数据中心而设计开发的第一代基于FPGA的智能网卡量产产品,很好的解决了行业痛点,因此已经吸引了很多大型云服务提供商的关注。相信在不久的将来,会有更多关于这款产品的详细信息和部署情况被正式公布,届时我会更深入的介绍关于Cascade Glacier的更多性能特点。


3.3

针对网络功能虚拟化的FPGA智能网卡

我曾经在之前的博文《白皮书技术解析 - 为下一代电信基础设施寻找有效的虚拟网络体系架构》中详细分析了FPGA是如何应用在网络功能虚拟化(Network Function Virtualization – NFV)这一新兴场景,并帮助中国电信实现电信网络的转型升级的。


通过NFV技术,电信数据中心网络可以实现转发面与控制面解耦分离,从而只需使用标准的服务器、存储和网络硬件设备,并借由FPGA的硬件加速,就能完成各类核心网络功能,而无需再购买配置各类专用的网络设备。


NFV是目前电信网络发展的大趋势,并非由英特尔提出。但可以发现,其核心思想与上文提到的英特尔“泛数据中心”的三驾马车不谋而合。英特尔也是目前唯一一家可以提供结合了传输、存储和计算的全栈式半导体解决方案的公司。


在2017年的甲骨文开发者大会上,英特尔公布了一款正在开发中的智能网卡原型机,如下图所示,并对使用这款智能网卡进行网络数据加解密的性能进行了现场展示。这款智能网卡基于英特尔Arria10系列FPGA,并包含一枚英特尔XL710以太网控制器,因此可以同时实现高速网络数据处理以及灵活的基于FPGA的定制计算需求。作为这款板卡最早期的FPGA开发者之一,我认为这款产品及其后续的升级版本将会在数据中心的网络功能加速领域有着广阔的前景。


4

小结

本文介绍了英特尔应对大数据时代的整体战略布局,特别是基于FPGA的各类智能网卡和网络解决方案。在下篇中,老石会继续介绍英特尔FPGA在人工智能和其他热点领域的布局和大动作,以及总结梳理一些FPGA开发会遇到的痛点和潜在的解决方案。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存