3月5日新的地球科学建模工具可提供更全面的预测结果
地球科学模型允许研究人员使用地球和相关系统的数字表示来测试潜在情景,从预测大规模气候变化影响到帮助为土地管理实践提供信息。然而,宾夕法尼亚州立大学土木与环境工程副教授Chaopeng Shen 表示,传统模型的参数估计计算成本很高,并且计算特定位置和场景的结果很难很好地推断到其他场景。
为了解决这些问题,Shen 和其他研究人员开发了一种称为可微参数学习的新模型,它结合了传统基于过程的模型和机器学习的元素,形成了一种可以广泛应用并产生更多聚合解决方案的方法。他们的模型发表在Nature Communications上,可供研究人员使用。
“传统的基于过程的模型面临的一个问题是它们都需要某种参数——方程中描述地球物理系统某些属性的变量,例如含水层的电导率或雨水径流——它们不需要没有直接的观察,”沉说。“通常情况下,你必须经历这个称为参数反演或参数估计的过程,在这个过程中你对模型将要预测的变量进行一些观察,然后你回过头来问,‘我的参数应该是什么?’”
一个常见的基于过程的模型是一种进化算法,它在许多操作迭代中进化,以便它可以更好地调整参数。然而,这些算法不能处理大规模或推广到其他环境。
“这就像我在修房子,而我的邻居也有类似的问题,正在修房子,我们之间没有任何沟通,”沉说。“每个人都在尝试做自己的事情。同样,当你将进化算法应用到一个地区——比如说——你将为每一小块土地解决一个单独的问题,它们之间没有交流,所以浪费了很多精力。此外,每个人都可以用自己不一致的方式解决他们的问题,这会引入很多物理上的不现实性。
为了解决更广泛区域的问题,Shen 的模型从所有位置获取数据以获得一个解决方案。与输入位置A 数据并获取位置 A 解决方案,然后输入位置 B 数据用于位置 B 的解决方案不同,Shen 输入位置 A 和 B 数据以获得更全面的解决方案。
“我们的算法更加全面,因为我们使用全局损失函数,”他说。“这意味着在参数估计过程中,每个位置的损失函数(模型的输出与观测值之间的差异)都聚合在一起。问题同时解决。我正在寻找一种解决方案“
沉还指出,他的方法在计算上比传统方法更具成本效益。通常需要两到三天才能完成 100 个处理器的超级集群现在只需要一个图形处理单元一小时。
“每个网格单元的成本大幅下降,”他说。“这就像规模经济。如果你有一家工厂生产一辆汽车,但现在你有同一家工厂生产 10,000 辆汽车,你的单位成本会大幅下降。当你在这个工作流程中加入更多积分时,同样的事情也会发生。同时,由于其他地点的参与,每个地点现在都在获得更好的服务。”
纯机器学习方法可以对广泛观察的变量做出良好的预测,但它们会产生难以解释的结果,因为它们不包括因果关系评估。
“深度学习模型可能会做出很好的预测,但我们不知道它是如何做到的,”Shen 说,并解释说虽然模型可以很好地进行预测,但研究人员可能会误解明显的因果关系。“通过我们的方法,我们能够从根本上将基于流程的模型和机器学习有机地联系起来,以利用机器学习的所有好处以及来自物理方面的见解。”
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。