论文信息
- APA引用格式:Asim, K. M., Martínez-Álvarez, F., Basit, A., & Iqbal, T. (2017). Earthquake magnitude prediction in Hindukush region using machine learning techniques. Natural Hazards, 85, 471-486.
- doi链接:https://doi.org/10.1007/s11069-016-2579-3
阅读感想
本文介绍了利用4种机器学习模型对发生在巴基斯坦兴都库什山脉地区的地震进行预测的方法。兴都库什山脉位于中亚,是东西向横贯阿富汗和巴基斯坦的山脉。该区域地质构造复杂,自古以来地震不断。自进入21世纪以来,震中位于兴都库什山脉的地震已夺走了数千人的生命。其中最为致命的是发生于2002年3月的MW 7.4级强震。该地震造成约1200人不幸遇难。
该研究组利用1977年至2013年中的70%(309个月)的地震观测数据对机器学习模型进行了训练,并利用余下的30%(132个月)的地震观测数据对学习后的机器学习模型进行了评价。最终,LPBoost方法的预测正确率最高,达到了65%。此外,其余3种机器学习方法(PRNN、RNN、随机森林)的正确率也都达到了60%左右。
令我特别感到惊奇的是,如图1所示,该研究组在使用PRNN和RNN方法进行训练时,他们仅使用2层隐藏层就收获到了正确率60%左右的模型。——要知道,地震学者们为了精确区分一个地震波形中的P波和S波,都要用上50多层隐藏层的机器学习模型(图2)!此外,他们所选用的特征量也仅有8个,而这些特征量也基本都是根据古登堡-里克特定律等基本经验法则推导出的。这些都意味着,训练模型时所需的时间、计算量等成本将异常之小,以至于普通的家用电脑都可以轻松训练出类似的模型。
一些疑惑
然而,读完该论文后,我产生了2个疑问。首先,该论文中的“预测”是否存在歧义?之所以这么说,是因为该研究组的“预测”并非是针对性的精确预测(即预测在某一时刻某一地点发生某一震级的地震),而是通过过去的地震观测结果来预测兴都库什山脉地区在下一个月内是否会发生M≥5.5的地震。因此,该论文所述的内容可能并非“预测”(prediction),而是一种类似于中长期评估的“短期评估”(assessment)。
其次,该论文中得到的机器学习模型是否真的有效?也正因该论文的目的是“评估”,该研究组可以利用非常简单的机器学习方法得出正确率看似较高的模型——因为时间的最小单位实在是太长了!根据统计,在近几十年中,兴都库什山脉地区每个月发生M≥5.5的地震的概率约为38%。这也意味着,即便不对模型进行任何训练,只要无厘头地让模型持续输出“0”(不会发生地震),其正确率的期待值也可以达到62%!
关于第1个问题,由于是用语上的问题,可能与地震预测的本质无关,因此在此处不再讨论。关于第2个问题,我想研究组已经在文中给出了答案。其通过LPBoost方法得到的模型,虽然正确率是4种方法中最高的,但是其特异性仅有36%。这意味着,对于现实中的确不会发生地震的情况,该模型可正确预测的概率仅有36%。如果让这种不够成熟的模型投入到社会中使用的话,这无疑会演变成一个新的“狼来了”的故事,使得社会各界对将来的地震预测研究持有更加悲观的态度。
写在最后
即便该研究可能存在着一些问题,但阅读过基于机器学习手法对实验室岩石破坏实验进行预测等相关文章的朋友们可能都知道,这篇论文在后来的文章中多次被其他研究组引用,以承认Asim等人在该领域的先驱性贡献。随着近年计算机科学和地球物理学的进一步融合,学界已经利用机器学习手法实现了高精度预测岩石破坏实验的岩石破坏时刻了。或许在可预见的将来,人类将借助机器学习的力量,掌握到预测地震的方法。在此基础上,通过分析抽出的特征量与地震事件的物理过程,得到一个更加清晰的地震发生的物理模型。
语言用法
- earthquake prone region – 地震多发区
- temporal distribution – 时间分布
- seismic quiescence – 地震平静
- inverse power law – 逆幂律
- LMBP = Levenberg-Marquardt Backpropagation – Levenberg-Marquardt反向传播法
- sensitivity – 敏感性(= TP/(TP+FN))
- specificity – 特异性(= TN/(TN+FP))
参考文献
- Mousavi, S. M., Ellsworth, W. L., Zhu, W., Chuang, L. Y., & Beroza, G. C. (2020). Earthquake transformer—an attentive deep-learning model for simultaneous earthquake detection and phase picking. Nature communications, 11(1), 3952.
标题图片
- File:Hindu Kush Range.jpg, User: Mansari007, CC BY-SA 4.0, via Wikimedia Commons.
1 thought on “真假难辨——来自巴基斯坦的地震预测研究”