查看原文
其他

丘成桐:数学和基本科学在应用科学中的重要性

丘成桐 数理人文 2020-08-19
本文整理自作者于 2019 年 10 月 17 日参加 2019 中关村论坛开幕式的讲稿。媒体或机构如需转载,请联系作者与《数理人文》(订阅号:math_hmat)。


(照片来源:中关村论坛官方微博)


今天,很荣幸受到邀请来参加这个大会,并讲几句话。


我在这里再次呼吁,希望国家重视基础科学和数学的发展。大家都知道,在家庭中,父母在外工作,维持生计,住房、吃饭、穿衣都是日常必须的。而有一项事儿,虽然不是立竿见影,但却是每个家庭都执意去做的,那就是孩子的教育。孩子身心的健康成长,是父母殷切的期望,明知要操劳十年二十年才见成果,但也甘心情愿。


基础科学的研究也是同样的事儿。我们不断投资在工业上,期望着迅速的回报,迎合社会的需要;但同时也将可观的经费,投资在基本科学上。为了国家的独立自主,长治久安,强大的基本科学是必须的。


记得在普林斯敦高等研究所当教授时,所长曾很自豪地说:我们在这里研究的是无用之学!这些无用之学在未来将会成为社会的盘石,国家的栋梁。


Abraham Flexner (照片来源:Wiki)


高等研究所第一任所长叫 Abraham Flexner。1939 年他在哈泼杂志(Harpers)上发表了一篇题为《无为知识的无所不为》 (The Usefulness of Useless Knowledge) 的文章【编注:中译本链接,指出法拉第(Michael Faraday)和麦克斯威(Clerk Maxwell)研究电磁学,不过是出于科学上的好奇心,接着赫兹(Heinrich Hertz)发现了电磁波。这些科学家并不重视电磁在人类社会的应用,但是他们的工作却是如此重要,不单单是理论科学划时代的成就,同时也是近代文明的一大贡献。


可以再举几个近代的例子,来说明基本科学和数学的应用。


我们知道在当今社会,互联网和计算机的能力极大,可谓无远弗届。能源的分配、大数据处理物流系统、道路交通、仿真神经元、蛋白质结构等问题都需要大量提升计算能力。这种能力有相当大的部分依靠计算机芯片储藏。电算机计算能力不断的增长,这三十年来,有所谓摩尔定律(Moore's Law),即每一年半,计算机的能力加倍。


但是,大家都知道,摩尔定律差不多达到极限了。计算机硬件的设计将要面临极大的瓶颈问题!


应付的方法有二:一个是利用基础物理的原理和基本数学来大力改革硬设备。另一个是大力改善软件,亦即是找到更好的算法,绕过硬件的速度和储存的能力。


Richard Feynman(照片来自网络)


先谈第一个方法。三十年前,伟大的物理学家理查德·费曼(Richard Feynman)提出量子计算这个方案,利用量子力学的基本原理来帮助计算。二十多年前,麻省理工(MIT)有位应用数学家叫 Peter Shor 的提出一个算法,利用费曼的提议去做大数字的因子分解,可以比古典的 RSA 的方法快得多,速度是指数增长。量子计算严重威胁现在通用的保密方法,因此政府官员、军事主管和银行监控部门都极为担心。他们投入了大量的资源来研发量子计算。


Peter Shor(照片来源:MIT News)


这项研究需要大量的数学家、物理学家和工程师的合作,美国名校有不少教授在做这方向的研究。而在实验方面,美国公司的投入规模更大得多,这包括了 IBM,Google,Microsoft 等公司。去年美国通过了 National Quantum Initiatives(NQI)法案,许多智库与政府官员都认为量子计算机就像二战前的曼哈顿核弹计划一样,关系着国家安全,需要政府全力支持。今年 IBM 给出 53 量子比特的超导量子计算机,可以通过云端使用。最近 NASA 宣布 Google 可以通过量子计算在 200 秒内解决世界第一的 Summit 超级计算机 10000 年才能解决的问题。中国的学者和公司也在做这方面的工作,但是基本物理和基础数学的水平不如美国,要在量子计算的研发上追上他们恐怕并不容易!


第二个方案的解决方法在于利用数学发展出来的方法。现在在研究的叫做人工智能和大数据。


人工智能已经从一种理念逐步转化为可应用的技术。这个领域近期的蓬勃发展基于三个重要因素:互联网技术带来的大数据;利用深度学习的标准算法来处理数据;超级计算机和云计算的强大计算力。然而,其中的数学理论却没有什么突破,这也是这领域存在诸多瓶颈的本源。我国的人口规模是发展人工智能的优势,在应用人工智能技术方面已经有了很多优秀的工作,处于世界前沿水平。只是在基础理论和算法创新方面,跟美国、英国等国尚有差距。想要在人工智能等核心技术在国际上领先,基础理论的突破不可或缺。


人工智能对大数据的处理本质上是数学中的统计学。然而目前尚没有完备的数学理论用以支持大数据分析的结果。很多数学方法还相对原始,过度依赖于经验总结,而非真正来自内在的数学结构。这也导致了当下人工智能在处理大数据问题时还需要大量的人力和算力,甚至需要超级计算机的协助。由于缺乏的数学理论的支持,很多大数据分析的结果只适用于特定环境,缺乏迁移性。大数据还缺乏有效的算法。经典计算机的算法并不能直接应用到大数据中。


广为流传的深度学习也有很多不足之处(大样本依赖,可解释性差,易受欺骗等),但当前没有更好的算法来替代。要解决这些问题,需要对相关数学理论进行深入的研究,了解大数据内在的数学结构和原理。目前的人工智能由于计算机速度限制,只能采取多层状结构解决问题,基于简单数学分析而非真正的玻尔兹曼机(Boltzmann machine),无法有效地找出最优解。在可见的未来,如何提升量子计算机的硬件,发展更有效的数学算法,让量子人工智能与量子深度学习变成实用工具,实在有赖于基础科学和数学的深度结合。


我的学生顾险峰和我及几位朋友,几年前发现我四十多年前在几何上的某些工作,可以应用到人工智能的理论研究上。由此可见,基础数学在工程问题上确实是重要的。


机器学习和人工智能(AI)等先进的计算方法已经在零售和娱乐等领域带来了显着的突破。这些方法也可能对医学和卫生保健产生深远的影响。全球的卫生保健系统包括美国和中国,都着手将临床信息数字化。可是,对如何分析和应用这些信息却还没有很好的策略。未来十年,数据科学和人工智能对医学的贡献可能超过其他所有技术的总和。人工智能和数据科学的医学研究变成医学和卫生保健的一个新领域。在这个崭新的领域里,数学和计算科学将会更广泛的为医疗决策提供支持。目前很多医疗系统的研究人员还没有意识到这一点,或者低估了这些影响。


我们希望能将最先进的计算技术应用到大型的、医学相关的数据库,得到有效的信息,并将之应用到医疗服务、临床诊断及相关的医学研究中。为了将人工智能和数学更好的应用到医学研究和卫生保健上,不同的学科需要共享合作。数学、医学信息学、计算机科学、生物统计学、工程学都将是研究工作不可或缺的。


以人工智能临床诊断为例,中国拥有全世界最大的临床医疗数据库,我们需要学习如何管理和应用这些数据,而通过计算科学和人工智能,我们可以以全新的方式利用这些数据,推动整个领域的发展。首先,我们可以利用机器学习模型消化更大、更丰富的数据集,同时通过机器学习的结果重新审视传统的预测模型的准确性。同时我们还可以尝试在自然的状态下改变额外的变量去提高模型的准确性,这种设置还允许进一步分析如何以及为什么新的技术和方法可能更好,以及在数学上有什么改进的可能。


目前人工智能和数据科学的技术已经被广泛的应用于临床诊断、手术指导、风险预测等不同的领域。在某些领域,计算机诊断的准确率甚至比医生还高,这是很大的进步,对临床实践影响深远。正是这样的成就进一步激发了科研人员的干劲。未来医学更大的变革,将会更依赖于数学理论的突破和人工智能技术的进步,那是毫无疑问的。


数学应用多姿多采,每人有不同的志趣,走不同的方向,大致上可以分如下几类:


• 数据科学,张量,大数据,人工智能,机器学习
• 数值优化,运筹学,及其在大规模机器学习中的应用
• 量子计算,量子算法,及其在机器学习中的应用
• 数值线性代数,矩阵计算,及其在数据科学中的应用
• 大规模科学计算和高性能计算,如计算材料科学,计算量子化学,计算电磁学等的快速算法和并行算法等
• 数值偏微分方程,有限元理论和方法,多重网格算法,(非)线性守恒律等
• 多尺度模拟
• 计算流体动力学,计算连续力学,如复杂流体,多孔介质渗流,界面问题,地球物理流,生物流体动力学等
• 数值逼近论
• 反问题的数值解法
• 计算机图形学,计算共形几何,图像处理,医学影像处理等
• 动力系统和混沌,非线性动力学,经典与量子(不)可积系统,耗散系统等
• 随机分析,随机微分方程,不确定性量化及应用,统计计算,蒙特卡洛方法等及其在机器学习中的应用
• 数理经济学,金融数学,精算保险等
• 数学生命科学,包括生物统计,生物信息学,理论神经科学等
• 博弈论
• 控制理论
• 数字信号(如地震波)处理,编码学
• 信息与通信科学
• 密码学


谢谢!


延伸阅读

1. Abraham Flexner, The Usefulness of Useless Knowledge,Harpers (1939).

点击阅读中译本:无用知识的有用性(王培 译).


欢迎关注《数理人文》杂志微信版

© International Press of Boston

微信订阅号:math_hmat

Modified on

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存