您当前的位置:第一教育网资讯正文

>深度学习求解「三体」问题计算速度进步一亿倍

放大字体  缩小字体 2019-11-03 02:04:10  阅读:6321+ 来源:自媒体 作者:AI科技评论

原标题:深度学习求解「三体」问题,核算速度进步一亿倍

作者 | 姜蔚蔚

修改 | 唐里

这篇论文企图经过深度神经网络来处理天体力学中闻名的三体问题。

早在牛顿的年代,三体问题就现已被提出,即三个可视为质点的天体在彼此之间万有引力作用下的运动规则问题,至今无法被准确求解。与之相对的,描绘两个天体彼此运动的二体问题可以经过牛顿力学完美处理。三体问题在国内的知名度部分来自于科幻小说家刘慈欣的小说《三体》,其间就描绘了一个日子在三体星系的地外文明,忍受着三颗恒星复杂多变的运转轨道带来的改变无常的气候,由此发生了星际移民并企图占据地球的故事。

从数学上说,每一个天体在别的两个天体的万有引力作用下的运动方程可以表明为3个二阶的常微分方程或6个一阶的常微分方程[1]。在三体问题中,对应了求解18阶方程。可是,物理规律只给了我们10个等式,包括3个质心方程、3个动量守恒方程、3个角动量守恒方程和1个能量守恒方程。因而从数学上完美求解三体问题是不可能的。

既然如此,数学家们放置了一般状况下的三体问题求解,转而寻觅特定条件下的解,例如法国数学家庞加莱就提出了限制性三体问题,即两体的质量极大,第三体不能对它们形成扰动的状况。在研讨这个问题的进程中,庞加莱提出了混沌理论,而且发现了三体问题中的“蝴蝶效应”:假如初始状况有一个小的扰动,那么后来的状况会有极大的不同。

与数学家们不同,核算机科学家采取了另一种思路,即经过近似和数值技能来核算剖析三体之间的联系。到了2015年,研讨人员提出了一个名为Brutus的积分器,根据Bulirsch-Stoer算法可以求解N体问题的恣意给定精度的近似收敛解。可是这种办法对内存的要求跟着精度的增高和模仿时刻的增加而呈指数级增加。

论文标题:Newton vs the machine:solving the chaotic three-body problem using deep neural networks

下载链接:https://arxiv.org/abs/1910.07291

在这篇论文中,来自爱丁堡大学、剑桥大学、阿威罗大学、莱顿大学的研讨人员企图经过深度神经网络来处理三体的核算问题。神经网络模型取得了跟Brutus十分挨近的核算成果,可是速度却快了一亿倍。如此令人震惊的速度提高作用引发了数学家和核算机学家关于这篇论文的重视和很多评论。

模型和试验

作者首要简化了三体问题,限制为三个质量持平、初始速度为零的粒子在一个平面上的引力问题。如图1所示:

图1. 三个粒子的初始方位。

粒子1的初始方位x1=(1,0)代表了间隔原点的单位间隔,粒子2的初始方位x2在图1中的绿色区域中随机发生,而由于对称性,粒子3的初始方位x3=-x1-x2。图1中的红点代表粒子2和粒子3重合的特殊状况,此刻x2=x3=(-0.5, 0)。

然后作者们运用Brutus模仿求解了10000次它们的三体运动,完结这些模仿花费了10天的时刻。接下来对神经网络模型而言,作者们运用其间的9900次模仿作为练习集,100次模仿作为练习集。这篇论文中运用的深度神经网络模型是一个包括10个躲藏层、128个节点前馈神经网络,如图2所示:

图2. 牛顿肖像画和神经网络模型。

练习进程采用了Adam优化器,每个epoch分为5000个batch,激活函数运用了ReLU。练习进程中均匀绝对差错随epoch改变的状况如图3所示,

图3. 均匀绝对差错vs epoch。

其间实线代表练习集,虚线代表验证集,3.9、7.8和10别离代表了运用的数据量的巨细,特别的,10代表运用了悉数10天生成的数据,即悉数数据集。

图4. 神经网络和Brutus成果的比照。

在图4中,作者给出了练习好的模型与Brutus核算成果的比照,左半边为练习集上的比照,右半边为验证集上的比照。三种色彩的曲线代表三个比如的运动轨道,而由于成果太挨近,实线代表的神经网络的轨道和虚线代表的Brutus的轨道简直无法分辩,代表经过练习的神经网络令人满意地再现了粒子之间的彼此作用。而神经网络的核算时刻(大约是10的负三次方秒)比Brutus快了十万倍(有时分乃至是一亿倍)。

进一步,作者们也比照了神经网络模型关于初始方位扰动的灵敏性。经过在x2的初始方位上参加一个很小的扰动,神经网络模型仍旧取得了跟Brutus附近的成果,如图5所示。

图5. 初始方位的灵敏依靠。

最终,作者们也测验运用神经网络来猜测粒子的速度信息,可是神经网络在求解问题的时分好像没有遵从能量守恒规律,作者们在人为参加一个能量投影层之后,才使得猜测差错从10-2下降到了10-5,如图6所示。

图6. 相对能量差错。

结 论

这篇论文成功验证了神经网络在混沌体系仿真中的运用,可以以更快的速度完结传统的办法(例如Brutus)的仿真作业,然后展现了在处理相似的复杂性问题上的运用潜力。

这篇论文的缺乏也是很明显的。很多人以为这篇论文仅仅一种概念上的验证,由于论文中的神经网络模型只能处理二维平面内而且初速度为0的三体问题。深度学习近年来的火爆使得它的运用早于超出了传统的核算机范畴。在物理范畴,从前就有研讨将神经网络运用于模仿中子星磕碰[3]。可是这种广泛的运用也引起了研讨人员的忧虑和质疑,例如Nature上一篇运用深度学习猜测地震余震[4]的论文就被质疑为深度学习办法的“乱用”。现在来看深度神经网络还无法彻底代替Brutus这样的东西。正如作者所说的,未来他们会考虑构建一个混合体系,当核算负担过重时引进神经网络,直到可以持续运用Brutus办法核算,然后可以更快地模仿星体之间的运动。

参阅:

[1] 浅谈三体问题, 甘庆雨, 2014. http://hpc.seu.edu.cn/dong/class/2014-Ganqingyu.pdf

[2] Boekholt T, Zwart S P. On the reliability of N-bodysimulations[J]. Computational Astrophysics and Cosmology, 2015, 2(1): 2.

[3] Adamczewski-Musch J, Arnold O, Behnke C, et al. Probing densebaryon-rich matter with virtual photons[J]. Nature Physics, 2019, 15:1040-1045.

[4] DeVries P M R, Viégas F, Wattenberg M, et al. Deep learning ofaftershock patterns following large earthquakes[J]. Nature, 2018, 560(7720):632.

2019 春季伯克利深度无监督学习小组

责任修改:

声明:本站所发布的内容均来源于互联网,目的在于传递信息,但不代表本站赞同其观点及立场,版权归属原作者,如有侵权请联系删除。