财政部唯一指定政府采购信息网络发布媒体 国家级政府采购专业网站

服务热线:400-810-1996

数据驱动与因果驱动的双向赋能

2025年06月06日 14:07 来源:数字中国打印

  中国工程院院士——薛禹胜

  尊敬的领导、各位来宾,我今天汇报的题目是《数据驱动和因果驱动的双向赋能》。

  汇报分成四个部分:

  一、信息-物理-社会系统 (CPSS) 

  我们知道电力系统经过了很长的时间,在智能电网方面进行了很多研究工作和应用,为了沟通电力系统在智能电网中的研究工作和其他的领域之间的关系,我在IEEE总刊上发了一篇文章,介绍了中国提出来的CPSSE (信息C - 物理P - 社会S - 系统S概念下的,能源 E – 环境 E – 经济 E协同发展)的框架,这个观点性的文章发表在IEEE总刊观点性栏目,栏目创立到现在近十年,能源领域一共有7篇左右的文章,中国机构仅有一篇,这篇文章阐述了我国的电网、电力走过了智能电网的道路,扩展到非电力的能源系统和非能源的物理系统,并且在不断继续扩展中。

  未来在以前的成果扩大基础上还要增加第三维的信息,社会系统包括政策以及人的行为等。这个开放的因素会越来越重要,我们知道电力系统是能源链中的核心环节,是沟通可再生能源和终端能源的革命,所以在支撑经济社会发展的同时,电力系统和能源链也是对于大气中以二氧化碳为代表的温室气体的主要负责源头之一。

  二、确定性模型整体还原(WRT)

  研究复杂系统之间的关系和正确引导政策制定,由此看到智能电网的概念实际就是针对行业能源中的核心环节,融合一个学科,包括Cyber和Physical,所以我们就形成了CPSP电力系统所讲的智能电网的概念。

  随着开放的新型电力系统和新型的能源体系的方向明确以后,我们在行业中就要扩展全部的能源链,引入环境链和经济链;在学科方面,除了在Cyber和Physical两个领域之中,我们还要增加社会因素,改革的时候离不开政策的引导也离不开每个参与者的行为方法。

  对于本来已经非常复杂的系统,因为引入了新的因素,使得复杂的系统变得更加复杂。下面讲的是确定性的模型是进行研究的方法。

  可以看到,复杂的系统是在一个非常高维空间当中随着时间变化的,对于非线性系统来讲,二维的非线性系统才可以量化求解。要达到一个较好的科学管理和控制效果,一定要解决从高维空间中转化到二维平面上的数学问题。数学模型是可以降阶的,哪怕降一阶,在大多数情况下可以接受,特殊情况下就会迎来比较大的风险,近几百年来人类在整个认知里贯穿的都是如何认识复杂的问题,在近40年当中,中国科学家解决了这样的问题。

  我们在生产机械零件的时候,例如轴承盖,这个过程它并不是在三维空间进行的,而是在几何视图投影平面进行的,按照这三个平面中制造出来的零部件完全符合原来的设想,这些信息完全保留。这个例子启发我们,高维空间上的信息是能够降阶的,我们通常说,在空间中丢失一个维度是不同的,而是将一个高维系统降到三个层面来讨论。物理系统中四维、五维,可以用视图表示,状态空间可以在线性空间表现出来。拓展一下,以四维的空间为例,在数学空间当中可以在三维空间里再增加一个平面,就可以把新的变量多元到原来的系统中。

  我们分析整个系统的时候,在每一个平面系统上并没有得到完整信息。以俯视图为例,这个圆到底是一个洞还是柱子看不出来,只有在其他维度上把它补充上来,如果要把全部的信息都保存在俯视图上,我们可以用颜色的深浅来反映高度信息,可以在这个平面包含整个信息。

  三维很好利用,我们可以在中国的卫星影像上看到海拔高度随着平面点的变化而变化。如果说增加一个维度应该怎么办,就提出了把一个复杂系统、一个新的观点分成两个部分。

  一个部分就是脱离具体的系统,还有一个部分就是指导问题研究来支撑它。 

  第二,时间的切片可以把非线性和时变性变成定长的线性化,然后再进行分析,因为桥梁映射是一个线性的矩阵,是可以进行变换的,经过理论证明,可以完全保留原来的性质。

  三、 基于符号串的预训练 (SPT)

  对于具体问题来讲,在这样的认识中要提供模型,要保证映射中的推导、映射的矩阵,另外还要求分段的线性化深层次知识的提取。把这样的概念应用到实际的复杂系统中,对于空间来讲是分成不同的行为模式,在时间上分成不同的时间段,在矩阵中把模式是怎么随着时间变化表示出来了,就可以把它的微结构表示出来。

  信息通过映射的方法映射到用光点来表示的时候,是不丢失的,这样一个概念用在了我读博士学位时创立的面积法则,这个方法是迄今为止国际上唯一一个得到严格证明的理论,并且得到大规模应用的量化方法,成功地支撑了电力防御系统。但是这碰到了两个本质上的困难。

  第一个困难虽能严格求解确定性的复杂系,难以应对高维不确定性。原来我们研究的电力系统,是把它的注入量和受到的扰动设定为已知,随着电力系统的开放、外部的一次能源的变化和自然界的极端灾害,包括日常管理、通信系统、人才的适应性和水平都会影响电力系统的正常运行,反过来电力系统的任何扰动也会影响到身边环境。

  第二个困难虽能揭示系统模型的行为机制,但并不是客观系统的行为机制。我刚才介绍解决的问题和颜色的部分边界条件和扰动情况是给定的,可以分析它并且把对策优化出来。这么高维的非线性的东西都是组合的,你如何指定确定性的分析边界条件这个问题到现在都没有很好解决,我们的目的是希望经过我们的分析能够反映实际的客观系统的规律性。但是我们现在没有办法做到,实际上研究的是把客观的复杂系统变成一个数学模型,是去研究一个数学模型的行为,这个部分是我们认识中已经解决的。

  刚才所介绍的整体还原论的理论,也是我国科学家在国际上首创的,能够把整体论和还原论结合起来的,并不能够保证模型反映客观协同,问题也没有解决。这两个问题本质的缺陷都可以溯源到原因,没有办法有效地顾及复杂的不确定因素影响,这个对我们因果驱动来讲没有办法做到,恰恰是人工智能,特别是语言模型的一个长处。我们知道大语言模型实际是反映了条件概率的分布问题,可以根据前面词汇的顺序预测后面的词汇,就可以在大规模的文本语料中进行预训练和微调,进行深度强化学习,这个方法已经是得到广泛的应用,具有非常强大的能力,并且也在不断地快速发展当中。

  WRT的这两个本质局限性都可以溯源到:难以有效计及复杂不确定性因素的影响,而基于统计学及概率论的AI 技术则适合于处理不确定性,这种方法和AI技术也都遗传了本质的局限性,数据和语料的可信度,另外在不同场景的泛化性和可解释性都比较差。

  在电力系统这样非常严格地要求可靠性和可追溯性的情况下能不能应用大模型就成为我们要解决的主要问题了。

  因此,我引入了这个主题,探讨如何将原本的整体还原论视为一种严格的数学方法,进而解析其中的机制并最终加以验证。该方法在底层由非常坚实的因果关系驱动。然而,在计算初始条件时存在一定的不确定性。例如,对于大语言模型或电力系统,我们提出的观点不能简单地照搬大语言模型的做法。相反,我们提出了一种符号串预训练技术,其基本概念与大语言模型非常相似,并且受其启发。然而,我们的方法不仅仅是给出一个结论,而是提供一系列可能的潜在风险结论。这是我们目前正在进行的一项新的研究工作,旨在将前述的两种方法综合成一种新的方法。这张图,表示的是因果算法和机器学习之间是怎么样进行算力赋能的框架。这里面每个箭头都是对另外一侧思维方法的支撑,可以分别介绍一下。

  四、SPT的统计观+WRT的机制观

  从1986年开始我开始在EEAC 算法中探索因果与AI 思维的融合,并不断完善后广泛应用于国内外的电力工程,我们把因果模型转化成积分的时候,完整的积分就是算子,可以把一个模型所有的信息和参数、故障反映在轨迹上,近百年的研究工作就止于这里,得到这个模型,后面工作就是靠人的解释和经验解读,但是这条路走不通,研究进展因此停滞。我们提出了一种方法,求出曲线并进行量化分析,从而突破了局限,在参数条件和故障场景给定的情况下可以量化分析了。但是,对于未来尚未发生的事件,我无法确定在何种系统参数和故障场景下进行分析。因此,如果是基于因果驱动的方法,我们很难在庞大的空间中找到应关注的重点。我们希望利用人工智能来解决这个关注度的问题,在极其复杂的环境中,找到在未来短时间内或特定时间段内应关注系统的哪个部分。这是我们当前需要解决的关键问题。

  在这个过程中,我利用了大量机器学习方法。虽然当时我对其了解不深,也不完全理解自己所做工作的本质,但凭借工程直觉,我对轨迹进行了分解,并在一个二维等值平面上将量化结果进行可视化,然后再将这些结果聚合起来,从而解决了原方案中的问题。经过这20多年的努力,我们已经有了国际上唯一的工程化软件,在国外,使用的都是20世纪末的出口软件,后来因为种种关系,他们担心我们软件没把源码给他们,他们就不愿意采用,我们也不愿意把我们的研究结果再输出了,所以我们是遥遥领先于国外的水平。

  在因果(EEAC)算法中,我们还可以引入人工智能因素,以协调因果关系的精度和适度。例如,我们有许多不同的近似因果算法。在使用积分时,可以通过不同的积分补偿方法来获得不同的精度。如果采用较大的积分补偿,虽然无法得到严格的积分结果,但可以得到一个近似的结果。如果我改用大补偿,用另一个更大一点的稍微修正一下,得到两个结果我就塑造到AI中去,如果刚才两个信号的差别很小,就意味着这个案例对补偿是不敏感的,所以我们可以直接按照近似的解来判断稳定性,如果发现这两个补偿改变以后结果曲线变化很大,就可以结合这样一个严格的因果算法,经过严格算法输出一个非常精确的结果。但是需要比较多的计算量,这样的方法就可以使天文数字这样的算力得到比较好地转化。

  在AI中,我们也可以利用因果关系算法中得到的中间结果,例如每个节点的注入量。由于涉及几十万个变量,获取的信息质量往往较差,因为难以确保所取的变量是关键变量。这些变量会随着不同的扰动而变化,使得确定关键变量变得复杂。如果我们把信息综合下因果关系用Y来表达它的注入量和拓扑结构,那么这个Y中的信息量就大大减少了,这是我们如何用因果关系帮助我们机器学习的例子。

  解决了算法层次上如何把人工智能和因果驱动两者进行结合后,在宏观上探讨这两者之间是否存在互补的地方。为此我们提出一个新的做法,现在研究团队正在全力做这个工作。

  这个工作我们使用确定性的整体还原,保证出口只要在你给定的条件下,它的出口是严格的,可以使用数学证明的,刚才讲到,第一,外界情况是变化的,比如台风经过福建的时候,是动态的可能转向,如果希望提前知道15分钟的情况,哪些线路处在核心区域、高强度的台风区域中,按照实际的台风走向,理清楚哪些线路风险最高,用这个东西从大到小进行风险排序,排成一系列确定性场景,人工智能起到的作用就是把高维的不确定性因素降维到一大批确定性的问题来解决,底层是有确定性的整体还原论保证出口的正确性,这是严格的,但是不确定性是靠人工智能捕获我们的注意力应该在什么地方,所以这两者结合就可以解决目前的难题,也就是说如何在不确定性问题的风险决策中解决确定性问题的决策。但是对不确定性的问题需要做人工智能的帮助。

  要打破现在的人工智能和语言模型的最大障碍,以电力系统为例,在严格控制要求情况下,需要解决的问题是能够把语言模型提供给确定性分析的模型仿真,发挥作用,这是两层模型,下层是非常严格的因果量化保证,可以保证它的出口是完全精确的,并且可解释的,但是故障系统的初始条件和考虑在什么扰动情况下分析确定性,这个交给语言模型来做,希望很快就可以做出一个实际的效果。

  直到现在,除了电力系统已经得到了广泛应用外,这些应用普遍存在一个局限性,即没有结合严格性。

  语言模型的出现使得我们重新反思了一下,解决一系列认识论中的协调过程,这些存在不同视角的协同,把两个表面上非常矛盾地统一到一个框架里,这是我们正在做的非常宏伟的一个设想。这个设想在国际上都是第一次提出,也没有其他方法在做。我们想到的就是用机器人的两只眼睛观测和左面、右面大脑分别主管不同的确定性分析和不确定性分析,这样就可以携手实现复杂系统的风险决策。我们用底层严格的整体还原论来表达,但是,高层不确定性的部分由语言模型来做,整体还原论就从一般的经验性判断扩展到非常严格的应用上面。

  最后简单总结一下。

  第一点我们处在一个发展动态的社会当中,我们的对象越来越复杂,一定要在决策中从确定性分析提升到风险性决策中去。第二点新型电力系统同CPSSE一样,是这个领域的护航者。第三点CPSS-EEE是南瑞集团提出新型电力系统发展的优化理论框架。第四点WRT是认识论中提出基础理论。第五点如何把基础理论和不确定性人工智能结合起来,以解决风险性方法论,这是一个非常重要的问题,特别是对电力系统,这些关键的技术中,不是只靠经验来解决问题的时候,我们希望能够找出一条新的路径。

  谢谢大家的关注。

  (以上内容根据嘉宾发言速记整理)