摘要:2017年10月,英国剑桥大学的一个研究团队提出一种利用机器学习(随机森林, random forest)预测地震的方法,研究人员通过分析地震前兆和断层之间的关系,发现了一个隐藏的地震信号——一种由于断层运动发出的特殊声音,并以此为基础训练出一个可以用来预测地震发生的模型。2018年9月,哈佛大学与麻省理工学院的研究人员开发出一种可以用来预测地震发生的人工神经网络模型。

全文共3552字,预计学习时长8分钟


AI预测地震:路还很长,但来日可期

图片来源:pexels


据中国地震台网正式测定,6月17日22时55分在四川宜宾市长宁县(北纬28.34度,东经104.90度)发生6.0级地震,震源深度16千米。截至6月18日16点00分,地震已造成宜宾市和乐山市8县(区)受灾,受灾人口142832人,因灾死亡13人,受伤199人(住院199人其中6人危重)。

“在大自然面前,人类是如此渺小和脆弱。”


此次宜宾6.0级地震想必让很多人想起了11年前的那场举国之殇——08年的汶川地震。


11年过去了,面对天灾,我们还是一样手足无措。但11年过去了,预知天灾,我们仍像当年一样无能为力吗?


很多网友表示地震前收到了广播预警和电视预警,一些安装了地震预警APP的用户也在APP上收到了预警通知。据了解,此次地震成功预警得归功于成都高新减灾所与应急管理部门联合建设的大陆地震预警网,成都高新减灾所研究的地震预警系统在此次地震中成功跑赢了“地震波”,提前61秒向成都市发出了预警通知。


这无疑是技术立功的又一案例,一些网友误以为此次预警是利用了AI技术,但事实上此次预警利用的就是“电波比地震波速度快”的原理,利用两者的时间差,来预警震中周边地震横波到达的时间。这实际上并不是地震预测而是地震预警,所以无法避免人员伤亡,但可大幅度减少人员伤亡。成都高新减灾研究所所长王暾博士表示,地震预警20秒伤亡可减少一半。


成都高新减灾研究所所长王暾博士详细介绍地震预警系统


AI预测地震:路还很长,但来日可期

地震预测仍是一大难题


同济大学结构理论研究所教授罗奇峰教授以及相关地震学专家在接受人民网采访时表示,地震预报是对尚未发生、但有可能发生的地震事件事先发出通告,而地震预警则是破坏性地震已经发生、抢在严重灾害形成之前发出警告。地震预报在全世界范围内仍是一大难题,但地震预警是完全可行的。


说到地震预测,先来辟个谣。曾经一度,网传地质学家李四光早就预测过我国60年内会有四大地震,唐山、汶川、玉树都一一应验,只剩XX市还未发生。这是谣言!纯粹的谣言!


李四光先生确实预测过四大地震,但人家又不是什么大罗神仙,哪能掐指一算就算得出具体地点,就算是现在的技术也无法准确预知地震究竟会在何时何地发生。他曾预测过四大地震带,分别是:


1. 东南部的台湾和福建沿海;

2. 华北的太行山沿线和京津唐地区;

3. 西南青藏高原和它边缘的四川,云南两省西部;

4. 西部的新疆,甘肃和宁夏。


AI预测地震:路还很长,但来日可期

过去100年中6级以上发生位置图图:GIS(by David Bressan)



然而,准确预测地震发生地对于科学来说仍然是一大玄学。一些专家甚至认为,人类预测地震的所有尝试都只是无望的努力。


在过去的100年中,地震至少造成了100万人的丧生。随着城镇化的进一步扩张,地震将带来更重大的人员伤亡和财产损失。这100年来,科学和技术使人类的生产生活方式发生了翻天覆地的变化,但是在预测地震方面,却始终没有什么划时代的突破性进展。


人类在研究科学的过程中,早已习惯通过观察事物并从中总结出规律。然而这对预测地震来说显然不太好使,因为你几乎没有办法从过往的地震经验中总结出什么有用信息来帮助你预测下一次地震。每一次地震的发生,结合实际发生情况来说,其中掺杂着许多随机和不确定性的因素,这难倒了一大批从事地质学研究的学者和科学家们。


全世界有许多高校实验室和研究中心都在做地震预测这一攸关人类生死存亡的课题。当人类进入AI时代,很多学者也开始致力于寻求AI的帮助,神经网络如何作用也是一大玄学问题,也许以“玄学”治“玄学”会给人类提供一个全新的解决问题的思路。


AI预测地震:路还很长,但来日可期

AI预测地震的进展


其实早在20世纪80年代和90年代,数学家和物理学家就曾尝试过用人工智能来预测地震,然而在当时受限于计算机的软硬件性能和数据的匮乏,该尝试并没有奏效。进入21世纪,人类进入大数据时代,各种高性能的机器学习算法被提出,同时计算机的计算和数据存储能力都显著提升,这为AI预测地震带来了新的转机。


2017年10月,英国剑桥大学的一个研究团队提出一种利用机器学习(随机森林, random forest)预测地震的方法,研究人员通过分析地震前兆和断层之间的关系,发现了一个隐藏的地震信号——一种由于断层运动发出的特殊声音,并以此为基础训练出一个可以用来预测地震发生的模型。研究人员表示机器学习算法可以找到这种声音中的规律,从而评估断层的压力以及发生断裂所需时间,最终进行精确预测。


AI预测地震:路还很长,但来日可期

用随机森林模型预测地震发生


2018年8月,谷歌人工智能实验室和哈佛大学的的科学家们研究出了一种人工智能模型,能够预测大地震后长达一年的余震位置。这个人工智能模型使用了最近10年的199次地震及其13万次余震数据进行训练,其中包括2004年苏门答腊地震、2011年东日本大地震、1989年旧金山地震以及1994年洛杉矶地震等著名地震。研究结果表明,该模型比目前用于预测余震的方法更加准确。


2018年9月,哈佛大学与麻省理工学院的研究人员开发出一种可以用来预测地震发生的人工神经网络模型。该团队主要针对近些年来地震频发的俄克拉荷马州进行研究,通过增加俄克拉荷马州使用地震仪的灵敏度,使用卷积神经网络过滤掉与地壳运动有关的干扰,让系统能够识别出哪些震动是由人类引发、哪些是地壳运动,最后通过对这种环境噪音的识别,利用AI系统检测出地震具体位置。


AI预测地震:路还很长,但来日可期

图片来源:by Jean-Francois Podevin


此后10月,斯坦福大学地球物理系的研究人员在哈佛和谷歌的工作基础之上,提出了一种被称为CNN-RNN地震探测器(CRED)的人工智能系统。其中,卷积神经网络(CNN)用来从地震仪数据中提取特征,而递归神经网络(RNN)用于学习地震仪数据的顺序特征,并且可以结合记忆输入提高预测的准确性。研究人员认为,该人工智能模型可以利用多个传感器,在构造活动区域进行实时监控,也可以作为早期地震预警系统的基础。


不得不提的是,尽管这些模型都取得了良好的实验效果,但其多是实验室中的模拟场景,真实地震要复杂得多,而且科学家们也承认神经网络也同样有其局限性,虽然神经网络善于在数据中寻找熟悉的信号,但对陌生的新信号就不一定同样敏感了。真正将其在现实世界中部署,仍然还有很长的一段路要走。


但梦想还是要有的,万一实现了呢?


就像洛斯阿拉莫斯国家实验室的保罗约翰逊所说的那样,AI的引入让地震预测有了新的希望,这是这个行业几十年来都没有看到的机会。


前路虽然漫漫,但好在来日可期。


AI预测地震:路还很长,但来日可期

Kaggle竞赛——LANL地震预测


用AI来预测地震可能会是未来学界的一大研究热点。前不久,Los Alamos National Laboratory(LANL)在Kaggle上举行了一场地震预测比赛,这次比赛的目的是通过声音信号预测地震到来的剩余时间。

此次竞赛用的数据是洛斯阿拉莫斯国家实验室的研究人员使用钢块与岩石材料(断层)相互作用来模拟真实地震,并使用压电陶瓷传感器记录的地震数据(声学数据),研究人员表示模拟地震数据与现实世界有所差别。


AI预测地震:路还很长,但来日可期

实验运行图


我们先来分析一下数据文件夹:

train.csv:文件大约2.03GB,包含629145480行数据,每行表示振荡幅度以及相对应的振荡时间;

test:包含许多小段测试数据的文件夹,文件大小约为242MB,由2624个 .csv文件组成,每个文件包含大约150000段数据。

sample_sumbission.csv - 格式正确的示例提交文件。此示例提交文件由测试数据seg_id及其对应的time_to_failure组成。对于测试文件夹中的每个seg_id,都需要预测上一段数据和下一次模拟地震数据间对应的单个time_to_failure时间。


再来分析一下特征:

acoustic_data:地震信号[int16]

time_to_failure:下一次模拟地震发生前的时间(以秒为单位)[float64]

seg_id:应对其进行预测的测试段id(每段预测一次)

实际上,这是一个预测time_to_failure的回归问题。

一些参赛者提供了一些可能的做法,分为特征工程和模型两部分。


特征工程部分:类似于声音识别(audio recognition)

1. 从时域做统计分析;

2. 从频域出发。


模型部分:可尝试Tree或者DNN

1. XGBoost:准确度高;

2. LightBoost:准确度接近XGBoost,但训练速度要快很多;

3. Catboost:对抗过拟合效果较好;

4. RNN/LSTM/1D-CNN/2D-CNN等。


一周前,此次LANL地震预测竞赛结果出炉,获得竞赛第一名的作者菲利普·辛格在medium上分享了他的此次比赛经验,他们团队最终提交的模型是对LGB、SVR和NN的三者混合。


总而言之,比赛和学术研究一样,因为有应用前景和研究价值才值得这么多人去参与。不得不承认,这些研究成果只有在经历数次考验确保其准确有效才能正式推广应用,否则反而会造成不必要的社会恐慌。就像“狼来了”的故事一样,两次预测不准,估计算法在公众心目中就不具备任何可信度了。


即使如此,为了子孙后代的基业着想,我们累计的数据和经验将成为可流传后世的宝贵经验。也许在未来某一天,AI不仅能够准确预测地震发生,还能以更加丰富多样的形式服务于人类社会,到那时,AI才会成为造福人类的宝贵功臣。

AI预测地震:路还很长,但来日可期

留言 点赞 关注

我们一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

相关文章