查看原文
其他

Mellanox为何让多家巨头公司“趋之若鹜”

老石 老石谈芯 2022-04-26

点击蓝字,关注老石谈芯


本周三(30日),有江湖传言称英特尔出价60亿美元左右竞购Mellanox公司。这已经不是Mellanox第一次传出将被收购的新闻了。在三个月之内,这家总部位于以色列的公司先后传言被Xilinx、微软和英特尔竞购,一时风头无二。

 

老石谈芯的读者们应该都知道,老石对这些江湖传言向来都只是抱着吃瓜的态度,比如之前写的这篇八卦文章。很巧的是,本次事件的三家竞购公司都是老石文章里的常客,这就引起了我极大的兴趣。

 

如果我们寻找一下英特尔、Xilinx和微软的共同点,很快就可以得到两个关键词:一个是“数据中心”,另外一个是“FPGA”。在本文中,老石就将结合这两个关键词,从技术角度分析一下为何Mellanox让这些巨头公司“趋之若鹜”。


Mellanox是谁

老石的文字功底不好,找不到更好的成语代替“趋之若鹜”,因此只能加上引号。虽然这个词本身带有贬义,但老石觉得Mellanox是真的优质资产。


Mellanox是一家著名的网络设备供应商,旗下产品包括网络控制芯片、网卡、线缆、交换机、软件等等,主要应用在数据中心里的各类网络连接,可以说几乎涵盖了数据中心网络产品的各大门类,见下图。


Mellanox的2018年财报非常亮眼,全年营收10.8亿美元,同比增长26%,毛利69.2%,运营利润24.8%。在老石这个外行看来,利润和增速都不错。


关键词一:数据中心

上面已经提到了第一个关键词“数据中心”。Mellanox的主阵地就是数据中心领域,并已经成为目前各大数据中心的主流网络解决方案之一。例如,在全球前十的大型公司中,有九家公司的数据中心就采用了Mellanox的方案,见下图。


Mellanox最早的主要产品,都是基于名为InfiniBand的技术,它是一种高速网络通信标准,拥有高吞吐量和低延时的特点。关于InfiniBand的内容并不是本文重点,在本文不再展开。

 

但值得注意的是,在过去的几年,Mellanox的产品线开始发生了显著变化,从以InfiniBand为主的产品,逐渐变化成基于以太网技术的产品。这使得公司营收也发生了很大改变,如下图所示,以太网产品的营收从2014年的不到18%,增长到2018年的接近60%,四年内增长7.5倍


以太网产品营收的增加,很大程度上归功于近年来数据中心领域的飞速发展。老石在之前的多篇文章中都说过数据中心是各家芯片巨头的必争之地。包括英特尔和Xilinx在内的很多公司,都在不断寻求战略转型,并且都将数据中心业务作为最重要的战略机遇。

 

在这样的背景之下,收购Mellanox便成为占领数据中心市场的一条捷径。在下表中,总结了Mellanox的数据中心产品系列与其他公司的对比,来源自Mellanox和Crehan Research 2018年的资料。


可以看到,相比其他供应商,Mellanox基本覆盖了全部数据中心网络产品。对于英特尔,自不必说收购Mellanox的好处。对于Xilinx更是能真正的“弯道超车”,开局三级甲三级包,一步拥有数据中心各类产品。对于微软,也能极大助力它目前正在不断发力的数据中心硬件产品研发。


关键词二:FPGA

在Mellanox的各类产品中,最吸引老石的当属它的智能网卡产品。在上面的表格中,老石特意加上了一项,即英特尔的智能网卡。这是因为老石在之前的文章中,介绍了英特尔最新的基于FPGA的智能网卡产品,有兴趣的读者可以看看。

 

Mellanox的智能网卡产品主要可以分成两类,一类是基于它自家名为BlueField SoC的产品,另一类则是包含FPGA的智能网卡,名为Innova-2 Flex,这也是老石更关心的。


通常来讲,智能网卡的“智能”之处,就是将很多原本运行在CPU内核上的应用,卸载到网卡上通过硬件加速器实现。特别是对于诸如虚拟交换、虚拟路由等与数据中心基础架构相关,而与数据中心用户无关的应用来说,如果用CPU实现这些功能非常不实惠,因为这样相当于变相减少了本来可以卖给用户的CPU内核资源。

 

相反的,如果将这些应用卸载到智能网卡上实现,就可以显著减少CPU内核的使用,同时降低网卡与CPU的通信量,节省PCIe带宽。

 

在Mellanox的这款智能网卡上,包括两个主要芯片,一个是Mellanox的ConnectX-5以太网控制器,另一个是Xilinx的Kintex UntraScale FPGA。这个板卡的结构框图如下所示。


可以看到,两个25G以太网端口都与ConnectX-5相连,然后再通过PCIe Switch连接Host和FPGA。ConnectX-5本身就可以实现不少硬件加速功能,比如常见的虚拟交换和虚拟路由卸载、SRIOV、QoS与流量控制等等。FPGA在这个卡上更像是一个“辅助”的加速单元,主要的设计目的是用来满足各种需要定制化的需求。

 

关于这个智能网卡上的FPGA,老石还看到以下两个特点。


第一,FPGA并没有直接连接以太网的接口。这也是为什么老石认为这里的FPGA更像是起到辅助功能的原因。这种结构与微软在Azure云数据中心里部署的智能网卡有显著区别。

 

在微软的基于英特尔FPGA的智能网卡中,FPGA是作为数据中心网络的唯一连接方式,并同时连接了网卡芯片及CPU,如下图所示。


这种方式的主要好处是可以将FPGA作为池化的加速单元,便于统一管理和分配。当某个服务器的FPGA不在使用时,可以被用来加速其他服务器的应用,而不会影响本身CPU的服务运行。

 

这也间接说明了微软对Mellanox的兴趣,如果一旦进行了收购,除了获得大量相关IP,还能极大的扩展智能网卡架构的灵活性。这对于英特尔和Xilinx都是一样的。


第二,Mellanox这款智能网卡上FPGA与CPU的通信方式,既可以是传统的PCIe,也可以基于OpenCAPI标准。


OpenCAPI是IBM等公司牵头提出的一种新的CPU接口通信协议,其主要目的是为了应对英特尔提出的PCIe标准,目前主要用于IBM的Power架构。


OpenCAPI的主要技术细节不是本文的讨论重点,但在OpenCAPI的主要成员中(下图),我们可以看到Mellanox和Xilinx的存在。结合二者在智能网卡的紧密合作,就不难顺流而下的想到收购的可能性。


结语

作为三个月内三次传出收购传言的公司,Mellanox无疑在目前吸引了很多业内人士的目光。老石认为,无论是谁最终获得Mellanox,都将在数据中心的日渐白热化的竞争中增加一块至关重要的筹码。


(注:本文仅代表作者个人观点,与任职单位无关。)


点击

阅读原文

看更多原创芯文、芯情、芯事

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存