您的位置: 技术市场>人工智能>

让科研人员站在AI肩膀上做创新

发布时间:2023-03-14 15:18:41  |  来源:新华网  |  作者:凌纪伟  |  责任编辑:徐丽丽

以人工智能(AI)为代表的新一轮科技革命和产业变革方兴未艾。这样一个时代,呼唤勇立技术潮头的搏击者,也一定能造就这样的搏击者。


作为首席科学家,张林峰是一个简单纯粹的人,一直执着攀登技术巅峰。作为深势科技创始人,张林峰怀有技术人共有的一个梦想,去追寻科技的星辰大海,做一家源自中国、面向未来、引领世界的公司。


AI for Science是公认的发生在当下的科学革命,张林峰带领着团队,成为这场科学研究范式的践行者。近日,记者走进位于中关村核心区的北京深势科技有限公司,专访公司创始人兼首席科学家张林峰。采访中,他结合从事基础研究的经历,分享了AI技术的最新趋势,以及AI对底层科研、对工业革新的推动作用。


AI加快基础研究转化效率


根基不牢,地动山摇。国家将基础研究作为科技自立自强的根基,足见其重要性。


无论是在北京大学读本科,还是在普林斯顿留学深造,张林峰所学的一直都是基础研究中的基础学科。十多年深钻细研,张林峰不仅坐住了“冷板凳”,更洞察到了其中的新变化。


基础研究是科学体系的源头,它能变不确定性为确定性,变未知为已知。“基础研究是一个国家核心竞争力所在。当下,国家需要的发展动力越来越指向基础研究,指向原始创新。”张林峰认为,基础研究的重要性毋庸置疑。


除了重要性,张林峰还发现,从原始创新到产业落地的效率和速度大大加快。“以前,如果说是30年的话,现在从原始创新到应用落地的这样一个链条,在我们看来只需要3到5年。”


从原始创新到技术,再从产品到商业化,每个环节没变,客观规律也没变,但时间为什么大大缩短?


“这是因为整个转化、流转的效率变高了。在这个过程中,我们需要经常改变我们的视角,去做一个更加全局的所谓技术上的‘诊断’。”张林峰说,当技术的卡点存在于原始创新这一阶段,一旦卡点被突破,下一个阶段可能就直接进入商业化,而不是产品这环节。


一方面重要性提升,另一方面从开始到落地的周期变短。在这样一个大背景下,基础研究其实已经迎来极为重要的发展节点。


正因为整个科研生态已经变化,张林峰提出,“必须在全新的视角之下,去定义我们最该做的、属于当下的事情”。在他看来,成立深势科技,引领“AI for Science”发展,就是他和团队当下最该做的事。


深势科技自成立就致力于运用AI和分子模拟算法,结合先进计算手段求解重要科学问题,为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。


对科研人员来说,时间比金钱更宝贵。深势科技就像是催化剂,帮助科研人员加速基础研究进程。


“可能我们第一波造福的不是产业界的人,而是同样面临前沿发展驱动下的、一些更加追求创新研究的科学家、科研人。”张林峰说,过去这些科研人员在给定的技术条件之下做实验、做理论模拟,但他们同样也需要跟上时代革新的步伐,站在AI的肩膀上做科研创新。


底层科技突破的重构意义


2020年,张林峰的科研事业迎来高光时刻。


由他作为负责人带领的团队,凭借新一代分子模拟方法研究成果获得当年度具有“超算界诺贝尔奖”之称的戈登·贝尔奖。该成果还与量子优越性、人造太阳等一起入选2020中国十大科技进展。


一直以来,人们都希望从第一性原理、从薛定谔方程这种最基本的规律出发,求解材料、药物、化工等普遍关心的微观世界的秘密。但由于算法过于复杂,哪怕用超级计算机,也只能算几十个、几百个原子规模的体系,但一个蛋白,加上周围的环境,至少几万、几十万个分子。换句话说,即便人类熟知微观世界的基本规律,但微观世界的复杂现象依旧无法用计算机模拟。


如何决定一款药物或者材料的性能,是一个原则上可算但实际上因复杂度太高做不了的事情。这个难点,正是AI可以发挥作用的起点。


张林峰表示,微观世界的数据通过AI学习,能够让AI掌握相应应用方向的物理规律。同时,AI也能做更大规模、更长时间尺度的计算,然后在高性能计算的优化下达到新的极致。


最终,项目团队通过机器学习将分子动力学极限从基线提升到了1亿原子的惊人数量,同时仍保证了从头算的高精度,效率是之前人类基线水平的1000倍。这是第一次把AI和物理规律、物理方程以及高性能计算紧密的结合。


回溯过往,戈登·贝尔奖的评选一直鼓励用最大规模的高性能算力去做最好的应用。张林峰团队的项目之所以获奖,其更大的意义就是能解决实际问题,并把相关行业的人才聚合到一起。


张林峰用“重构”这个关键词定位这项获奖成果的核心意义。“它更广泛的影响在于学科的重构。其实所有这些行业已经因为AI和计算能力的提升被重构了。这样的重构,也意味着人们的知识体系、协同模式以及复合学科的重组。”过去,数理化、计算机、生物医药和材料都是分散的学科,这些学科之下又分了很多类型,这些细分类型零散分布于这些学科下设的三级目录中。而基于AI的分子动力学模拟方法,将精确的物理建模带入到更大尺度的材料模拟中,为打通力学、化学、材料、生物乃至工程学科,解决实际问题发挥出积极作用。


正如张林峰所言,基础研究到应用落地的周期缩短,这与机器学习模拟上亿原子这类重大科学突破密不可分。底层科技突破的意义,就在于可以催生出一系列新的创新。


比如,药物研发难度大、投入高、风险大、周期长。张林峰以药物研发举例说,要破解其中的核心瓶颈,就需要进一步求解物理方程和分析大量数据的能力。受益于技术红利,结合AI、物理模拟、仿真等一系列技术,能够让药物从立项到临床前的整个研发流程大大缩短。


这项能力是AI的这一波进展带来的。在药物、材料研发等更广泛的领域,印证了张林峰谈到的“从基础研究到落地应用只需三五年时间”。


AI大模型的工业应用前景


近期,火热的ChatGPT引发业内人士思考。事实上,超强算力、大模型技术并不新鲜,但能将这些技术发挥到极致,让人觉得产品有用却并不容易。


在张林峰看来,ChatGPT的产品形式非常巧妙,它在开发之初就在思考这种产品怎么才能被用起来、以怎样的技术形式规模化落地。“从原始创新一直到产品,到大规模落地,这么大规模的一个原始技术突破的过程中,能够做到这么高的效率,其实非常值得大家思考。”


预训练模型是推动AI应用的重要基础设施,也是全球科技巨头竞相角逐的焦点。


与ChatGPT专注自然语言处理不同,去年年底,深势科技、北京科学智能研究院(AISI)以及项目合作者,联合发布了首个覆盖元素周期表近70种元素的深度势能原子间势函数预训练模型“DPA-1”。这一创新成果在模型覆盖范围、通用性、计算精度以及未来的AI生成等方面实现新突破,被视为AI for Science走向大规模应用的重要里程碑。


用过“DPA-1”的开发者们会发现,它就像是自然科学领域的GPT。根据需求,“DPA-1”像万物之手一样,能生成需要的物质组分和结构。它为什么能够做到呢?


此前,曾获戈登·贝尔奖的创新解决方案,其实是基于量子力学生产数据,AI学习这些数据,学完后大规模模拟。如今,这个范式已经普及,量子力学生产的数据越来越多,多到已经几乎要覆盖整个元素周期表。这使得这样一个领域也具备了走向预训练模型的数据基础。


“3年前,我们就想做这件事情,但是时机不成熟,原因是数据基础不到位,现在做其实是最合适的。从社区生态上,从模型和数据的发展上,乃至从整个技术趋势上来看,这样的一个预训练模型也是呼之欲出的。”张林峰曾说,“应该用全新视角定义当下该做的事情”,在他看来,这件事很显然也属于当下该做的事情。


在其他领域,GPT的迭代周期都比较长,但张林峰认为在分子模拟这个领域也许走得会更快,应用落地的深度也更深,这是他和团队今年格外要解决的重点问题。


目前,科学计算的瓶颈在于算法面临“维度灾难”的问题,即难以表示和难以有效地处理高位复杂的函数和大规模的复杂数据。幸运的是,AI有望助力解决科学计算中的“维度灾难”,将不同尺度的物理模型有效连接起来。


AI向前发展有其自身规律。张林峰说,我们要做的就是借鉴AI的客观发展规律,无论是技术侧还是产业侧的一系列发展特点,去反思我们的技术体系。


他举例说,过去人们曾质疑AI落地的效果,其实把前人在不同应用场景的经验整合起来,去“翻译”好我们的场景,比如工业软件这样的场景,需要启蒙。深势科技兼具了翻译者、启蒙者以及最后从顶层创新到落地的角色。


生态协同打造工业软件平台


AI给基础科研带来机遇,除了凸显基础研究的重要性,也在改变从创新到落地的整个生态。


工业软件被誉为“工业皇冠上的明珠”,过去一直是海外厂商占据的领域。随着AI时代的来临,中国在AI领域也具有显著的人才、数据、市场、应用等优势。在AI时代,工业软件也迎来新的开始。


张林峰认为,工业软件容易被卡脖子关键不是软件背后的原理,而是生态。它的背后需要底层算法,规模化的软件协同,以及软件开发完之后,作为一个解决方案跟场景的落地迭代,以及反过来反哺创新。基于这样的一个生态,持续迭代后,它才会越来越稳健。同时,工业软件是工业智慧的结晶,必须要以工匠精神往深做。


对工业软件平台的创新,张林峰提示,要告别过去,用崭新的思维去做。他说,单纯算法的突破、底层硬件的突破,往往会沉淀成过去的惯性,变成一种创新的历史包袱,反倒难以升级。他以深势科技开发的药物设计软件平台为例,认为该平台可能比已经成长了20多年的国外平台更轻便,是因为深势科技要做的不光是一种产品形态和技术形态的革新,而是依靠整个公司迭代的体系和不同研发人的角色配合,才能推动这种全新的工业软件平台的诞生。


深势科技提出,专注于打造微观尺度科学研究和工业研发的基础设施。张林峰一直向研发人员强调,“软件不是开发出来的,而是被用出来的,以需求和反馈为导向,持续优化才是工业软件的真正壁垒。”


“没摸过的东西,去想象我觉得不是很好。”张林峰说,为了发论文而发论文不是我们鼓励的,基于对问题更好的定义来发论文是非常好的。


张林峰鼓励公司研发人员自由探索,认为营造这种宽松的科研氛围才能培育创新的土壤。其次,注重从定义问题到实现目标过程中的协同机制,要求大家既要自我驱动,也要观点碰撞,然后再建立分工,营造一个共同赢球的团队文化。同为科学家,他本人也一直跑在第一线,与做合金、做电池、做药物研发的一线企业面对面交流,倾听客户的反馈。


从优秀变得卓越,意味着要树立更长期、更朴实的价值追求。“我们从科学发展规律、从方方面面的认知,去定义未来长久的目标,然后在这个目标下,去倒推哪些是属于公司当下该做的事情,然后持续演进。”张林峰说。


创新既是决定未来的关键变量所在,又是推动人类社会进步的核心动力。


深势科技成立的初衷就是希望成为一家源自中国、面向未来、引领世界的公司。“未来几年,可能是一个重构的周期,我们希望经历这样一个重构,在最后回头来看时,我们是成功的。”张林峰也深信,如果公司能够推动国内形成一个真正原始创新到落地应用的良好生态,能够成就所有合作伙伴,那公司必然就是成功的。


展望未来,张林峰希望通过不断商业化倒逼公司形成新的技术体系。他坚信,AI的能力还需要进一步唤醒,AI的应用也要深入到科学研究的更深处,能够服务于能源、原材料等国家重大战略需求,这是公司也是整个生态未来努力的方向指引。

  

  


 
分享到:
0