查看原文
其他

中美日欧激烈竞争的这个领域,现状怎样?

地球村公民 庐山真容 2023-09-20

前言:上一篇→ 算力发展简史  ,本篇主要谈中美日欧激烈竞争的超算。

请耐心看完,就会明白:关心算力,人人有责!



一、超算


超算,即超级计算机,国之重器。


“超级计算”(supercomputing)这名词第一次出现于1929年的《纽约世界报》,一篇关于IBM为哥伦比亚大学建造大型制表机(tabulator)的报导。上一篇文章提到的美国曼哈顿计划里广泛采用的穿孔卡片式计算机就是一种制表机。


美国从1790年开始, 每10年就进行一次人口普查。1880年的人口普查统计分类数据浩繁,花了7年时间才处理完毕。于是催生了制表机的诞生。现在说的超算与这种古董级别的制表机没有关系,而是指超级电子计算机。


超算不仅用于新冠的防治,还可以防治其它疾病,并为开发下一代疫苗和疗法提供线索。超算冠军美国的“前沿”被用于分析1100万个基因组,以更好地区分和预测病毒变异。

橡树岭国家实验室根据研究的价值,允许来自世界各地的科学家使用“前沿”超算,并要求使用这台超算的科学家发表他们的研究结果。

超算能为能源、医药、飞机制造、汽车与娱乐业、云计算等广泛领域的行业提供高性能计算服务。


人们常说,“要算过对手才能赢得竞争”。
拥有最快超算就可以做最好的科学。因为有了更好的超算,就可以在计算解析中获得更高的准确性,并且节省更多的时间。


二、数量级


用英文字母K、M、G、T、P、E......表示数:

方式一,1000进制:
① K:10001,103,千,千
② M:10002,106,兆,百万
③ G:10003109,十亿
④ T:10004,1012,太,万亿
⑤ P:10005,1015,拍,千万亿
⑥ E:100061018艾,百亿亿
⑦ Z:10007,1021,泽,十万亿亿
⑧ Y:10008,1024,尧,亿亿亿

硬盘厂商就是按照上述1000进制标注硬盘容量的,苹果的Mac也是采取这个标准。同样的硬盘放在windows电脑内,容量显示则明显“缩水”。要注意的是,中文里"兆"既可以表示百万也可以表示万亿(百万的百万),经常把人搞晕。


方式二,1024进制:

① K:210,10241

② M:220,10242

③ G:230,10243

④ T:240,10244

⑤ P:250,10245

⑥ E :260,10246

⑦ Z:270,10247

⑧ Y:280,10248

内存厂商和微软的windows则是采取1024进制。

现在最快的超算为E级,即EFlop/s级(每秒浮点运算次数为E级)
那么这里的E究竟是1000进制的E还是1024进制的E呢?
1024进制的E:260≈1.1529215×1018
比1000进制的E要大15%以上。

虽然根据1998年国际电工委员会(IEC)的标准,1024进制要在字母后加上“i”,即Ki、Gi、Ei等,但此时内存厂商和微软的K、M、G、T标注标准已经被电脑用户普遍接受。这样就导致K、M、G、T、P、E等存在两种不同的计数方式。

2005年6月和2019年6月超算TOP500排行榜两次升级计算速度的单位,第一次由GFlop/s升级为TFlop/s,第二次升级为PFlop/s,都是按照1000进制转换的。所以可以确定超算计算速度计数是采用1000进制的。


三、冠军争夺战(1993~2023)


从1993年6月开始,TOP500发布全球超级计算机排名,每半年更新一次。每年正式发布时间为六月、十一月。到今年6月为止,已经发布了61次。一共有20台超算获得第一名,全部由中美日三国包揽。


其中美国夺冠33次,日本17次,中国11次。冠军在三国之间易手13次,在中美日国内易手7次(1994下与1993下第一名为同一台机器,中间断开一次)。


本文图表中算力是指超算稳定运行的最高计算速度(Rmax)。单位:
PFlop/s:千万亿次浮点运算/秒,
TFlop/s:万亿次浮点运算/秒;
GFlop/s:十亿次浮点运算/秒。


四、中美日TOP500上榜台数(1993~2023)
先看官媒制作的两张图:

再看看本人制作的走势图:

整个1990年代,中国大陆总共只有5台次超算上榜,而台湾有23台次,香港有17台次。而日本则有1169台次,美国有3714台次,美日两国上榜台次占比合计为69.8%,其它主要是是德英法等欧洲国家。
加入WTO后,中国上榜台数开始发力,2011~2014年有一个小高峰,每次有六七十台上榜。2017下~2020下迎来高峰,每次超过200台上榜,而美国降到最低点,只有110~120台左右,日本则只有30台左右。

注:为了节省篇幅,这里省略了一些详细的数据表格,有兴趣的读者可以加我微信索取。


五、中美日TOP500上榜算力走势(1993~2023)

国内媒体津津乐道报道上榜台数超美,绝大多数情况下对上榜算力只字不提。为什么?请看:

2017年下,中国上榜算力占比达到惊人的35.2%,超过美国的29.3%,这是这个指标唯一一次超过美国。之后中国走低,2023年6月跌到8.9%,同期日本12.5%,美国45.8%。

2010年前,34次排名,美国算力占比平均高达57.5%,2005年11月份高达68.3%。2010年后,27次排名,美国平均占比为40.8%,最近三次都超过这个平均水平。


六、最新TOP500
2023年6月TOP500各国上榜台数和上榜算力:

上榜台数美国回到第一,之前连续11次中国第一(见上文:)。

欧盟开始发力,19国(加英国)上榜126台,算力占比24.55%,大致恢复到了2000~2010的水平。2005年前后,英国一度同德国、日本争夺第二名。如今英国退步严重,上榜算力占比才1.19%,甚至低于俄罗斯的1.41%。这令英国科学家忧心忡忡,督促首相苏纳克加大投入。


七、最新TOP200

2023年6月TOP500前200名排名:

TOP200各国上榜台数和上榜算力占比:

TOP200强,中国大陆只有6台上榜,上榜算力占比3.76%;而美国72台上榜(中国12倍),算力占比48.84%;日本24台上榜,算力占比14.03%。前100强,中国两台上榜,美国33台,日本11台。

八、最新TOP10

2023年6月TOP10:

1. Frontier(前沿):位于美国田纳西州橡树岭国家实验室,由HPE Cray EX235a架构构建,配备AMD EPYC 64C 2GHz处理器和AMD Instinct MI250X加速器,使用Slingshot-11互连。该系统有8,699,904个核心,HPL性能达到1.194 Exaflop/s,是唯一一台E级超算。
前沿不仅算力鹤立鸡群,而且环保性能在TOP500排名第六,在TOP200中排名第四。同中国的天河2号相比,前沿的能耗/算力指标只有天河2号的1/16。
按照清华大学科学史系某博士后的说法:若以国内目前传统技术方法构建一台E级超算,年能耗将会超过三峡水库发电量的1/3。我核对了一下,应该是每年耗电30亿度,约占三峡发电量的1/30,这也是惊人的数字。

2. Fugaku(富岳):位于日本神户市的理化学研究所计算科学中心,由富士通开发。2020~2021年曾四次位居榜首。富岳跌下第一即令日本科技界和企业界担心。东京大学公共政策学院教授铃木一人解读称,超算事关经济安全和独立。

据《日经新闻》介绍,日本机床公司森精机使用富岳超算,能够在10分钟内得出材料加工的测算结果,而通过机器实验,这个过程可能需要8个小时。(财联社)
3. LUMI:位于芬兰的欧洲高性能计算中心/CSC,是欧洲最大的超算系统。这台机器隶属于欧洲高性能计算联合事业部,将为欧洲多国提供超级算力的服务。
4. Leonardo(达芬奇):位于意大利的欧洲高性能计算中心/CINECA。与第三名一样主要服务于欧盟。
5. Summit(顶点):与第一名前沿同属橡树岭国家实验室,2018~2019年曾四次夺冠,该实验室还有一台超算排第34名。
6. Sierra(山脊):位于美国加利福尼亚州劳伦斯利弗莫尔国家实验室。
7. 神威·太湖之光:位于江苏省无锡市的国家超级计算无锡中心,由国防科技大学开发,采用国产SW26010处理器和 Sunway网络互连。该系统有10,649,600个核心。2016~2017年曾四次夺冠。
8. Perlmutter:与第6名同属劳伦斯伯克利国家实验室,该实验室有5台超算进入前200名,一台排名第36。
9. Selene:位于美国的英伟达公司总部。这次英伟达公司拥有的超算有7台上榜,其中4台进入前100名。
不难理解英伟达如今牛气冲天,占据人工智能芯片的垄断地位,市场份额超过90%。
10. Tianhe-2A(天河-2A):位于广州市的国家超级计算广州中心,由国防科技大学开发,采用Intel Xeon E5-2692v2处理器和Matrix-2000 GPDSP加速器,使用TH Express-2网络互连。该系统有4,981,760个核心。2013~2015年连续6次夺冠。之后把接力棒交给神威·太湖之光,使得中国超算连续5年10次占据冠军宝座,2年4次垄断冠亚军。
天河2号横空出世,开启了中国超算连续多年的高光时刻。时至今日,在百度搜索输入“最快的计算机”,第一条搜索结果就是“天河2号”,之后还有几篇今年的煞有介事的最新排名,都是天河2号第一。可见百度的“算力”水平,和中文作者的平均水准。我估计很多读者是看了这篇文章才明白天河2号原来早就不是第一了。

九、不进则退

超算竞争异常激烈,不仅表现在国家之间,而且表现在国家内部。首先计算机芯片遵循摩尔定律,其次超算所用芯片有越来越多之势。所以超算算力增速快于摩尔定律。

最新TOP500平均每台超算有19.1万个CPU核心,其中太湖之光排第一名。太湖之光用了40,960个国产SW26010处理器,每个处理器有260个核心,核心数260×40,960=10,649,600。TOP500中,核心数低于2万的只有13台。

上图可以看出TOP500总算力(Sum,深蓝色)、第一名(Top,红色)、第500名(#500,黄色)算力呈几何级数增长。1995开始,每11~13年,算力增加1000倍;2010年开始,13年,算力增加100倍。

2010年11月,排名第500名的超算,在2010年6月只排名305名。意味着,2010年6月前500名的算力,会有195名(如果升级算力的话则可能没落榜,下同)在2010年11月落榜。

2015年11月,有133名落榜;
2020年11月,有37名落榜;
2022年11月,有40名落榜;其中中国13台落榜,新上榜2台。
2023年6月,有44名落榜;其中中国29台落榜,新上榜1台。
2021年6月,中国新上榜的还有9台,落榜37台。

短短3.5年时间,中国超算上榜台数从228台跌倒134台,而算力占比则从32.3%下跌到8.9%,跌幅高达72.4%,如此下跌速度在主要国家中极为罕见。
前文提到,最新超算200强里中国大陆只有6台上榜,上榜算力占比3.76%;而2017年11月,对应的数字为33台、算力占比29.9%。短短5.5年,算力占比下降87.4%。

十、厉害体误国
2013~2015年,天河2号连续6次问鼎超算榜,各种狂轰滥炸报道,自媒体充斥各种“厉害体”。
结果,2015年4月,美国商务部宣布将与“天河2号”相关的4家中国机构列入实体清单,理由是“该超算用于模拟核爆实验”。美方此举旨在限制英特尔等公司向中国出售超算芯片。不过2018年6月之前,还是用英特尔至强处理器升级一次,速度从3.386亿亿次/秒升级到6.144亿亿次/秒,让其问世10年后还能达到前10名,极为罕见。
2018~2019年,美国橡树岭国家实验室的“顶点”连续四次夺冠。国内报道不屑一顾,各种厉害体满天飞。尤其严重的是,大量炒作称中国有三台E级超算原型机,即将甩开美国N条街。2019年6月,美国商务部再次对中国另外两家超算巨头“曙光”和“神威”相关的5家企业列入实体清单。
厉害体继续满天飞:中国超算上榜台数已经是美国的两倍啦,美帝吓尿了。
2021年4月8日,7家中国超算相关机构被美国列入实体清单。
厉害体声称:中国有多台超算达到E级,完全不屑于参与国际评比。中国超算专注于国内竞争,对国际对手早已不用关注。 就像中国乒乓球,国际水平仅仅是中国国内的二流水准。
2022年,8月9日,拜登正式签署《芯片和科学法案》,大力促进美国芯片产业回归。
2022年8月底,美国限制英伟达和超微半导体公司向中俄两国出口GPU高端芯片。
后来,还联合盟友出台一系列限制中国获得高端芯片的措施。

上图是美国半导体协会(SIA)发布的数据。2022年,美国拿下了48%的芯片市场,韩国19%,日本9%,欧盟9%,台湾地区8%,以上合计93%;中国大陆7%。这让美国具备了“既当运动员又当裁判员”的实力。美国人有时说:我们发明了电子计算机、芯片、互联网.....这不是他们的厉害体,而是在落后时用来反省。

中文网上,盛传美国曾经打压日本的芯片产业。我仔细研究了来龙去脉,其实主要是要求日本开放芯片市场等,这算打压吗?中文网还盛传广场协定是美国打压日本,让日本“失去20年”。你要把这个说法同日本人讲,对方一定一脸懵逼。

2023年7月25日,欧盟《芯片法案》在欧盟理事会获批,法案只待签字生效。该法案旨在将欧盟在全球半导体市场的份额翻一番,从现在的约10%提高到2030年的至少20%。
芯片产业是一个全球上亿人直接共同参与的生态系统,是几十亿人智慧的结晶。没有任何一个国家可以单独解决。因为这比造原子弹的难度起码高两个数量级,隔壁朝鲜都可以勒紧裤带造出原子弹。


十一、量子计算


所有过往,皆为序章。

随着量子计算、光电子计算等技术的发展,算力增长在接下来的时间可能会迎来一波高峰,因为与传统的CPU、GPU等相比,量子计算是颠覆式的。


但目前的技术,量子计算的稳定性和适用领域还严重受限。根据Yole提供的数据,量子技术市场平均每年增长率为13%,将从2022年的7.61亿美元增长到2025年的10.99亿美元。而2022年,中国算力核心产业规模达1.8万亿人民币。所以,要谨防骗子打着量子计算的名誉招摇撞骗,结果骗子成亿万富翁,你成韭菜。



十二、算什么?怎么算?

算力发展简史已经谈到万物皆是数,既然如此,一切都可以算。

那还剩下一个问题:怎么算?


一)、是不是你安装一个手机APP,对方要求你每项都同意(一般人不知不觉中全部同意了),仍后你在对方面前完全成了一个透明人?

这就是一个隐私关系问题:①个人与公司,②公司与政府,③个人与政府。


二)、“怎么算”还包括具体的算法问题。是不是我偶然看过阴谋论的信息,互联网就没完没了向我推送阴谋论的信息,让我掉入阴谋论的陷井,成为不可自拔的超级傻叉?

三)、“怎么算”还包括:把任何具体问题转化为模型,再让计算机来进行计算。中国在超算软件和超算应用方面,人才同美国相比差距非常大。

十三、算力公平
算力即力量。假设:
一)、美国掌握了最大的算力,请允许我在此做一个假设:美国堕落成独裁国家,美帝总统一人掌握巨大无比的算力,那么美国人将真正要掉入水深火热之中,全世界人民也会跟着遭殃。
假如地堡男孩掌握最大的算力呢?
二)马斯克称2024年前投入10亿美元,誓让特斯拉的超算进入前5。马斯克规划的特斯拉超算Dojo2024年10月24日算力达到100E,是现在冠军前沿的算力的84倍。这当然是天大的牛皮!

请允许我再做一个假设:按照这个发展速度,到2025年,马斯克掌握的算力将比全球80亿人掌握的算力高出一个数量级。以马斯克随心所欲的个性,你不颤抖吗?

举一反三,请思考10秒钟!

所以:

算力公平、算力立法至关重要。

关心算力,人人有责!

(待续)


——地球村公民占全喜
2023年7月29日

其它文章:

算力发展简史

拜登经济学或将让美国经济长期保持辉煌
详解莫迪在美国会演讲百余次掌声
《美印联合声明》全文翻译 

为了可以收到信息
建议置顶,设置星标
爱好和平、反对侵略的读者,可以加个人微信,方便入群。请务必开放朋友圈,标注读者或防失联字样。

本人关注国际局势近40年,力求全方位理解各方立场,多维度深层次分析问题,把一生求真结晶奉献给社会。力求至真至诚至善!
经常有人诅咒我和全家,还有各种举报。但也有读者赞我写的文章中肯而有深度,令我深受鼓舞。
本人五十有五,为一家3代5口(原4代6口)唯一有收入者。此乃家事,本不应提及,无奈天下事同家事已密不可分。
由于经常遭受赶尽杀绝式的封杀(公众号+微信号),经常导致难以为继。
问:为什么经常中断更新?答:公号全被封或禁。
问:文章都去哪儿了?答:要么单独被删,要么随号被团灭。
失联的朋友可加:dqcm68(上面有二维码)。

全文5800字,还制作了大量图表(感兴趣的朋友可以找我继续索取),耗时超过100个小时,查阅了数百万字资料,有时为了一个准确数字,花费上个小时。感谢朋友通过下面二维码表示支持,总有一丝光让人泪流满面:

可调整字体大小方便阅读,方法:点右上角→调整字体→最下选择
感谢三连:转、赞、在看。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存