导航
English GitHub
E-mail geosoftpku@tom.com
E-mail geosoftpku@tom.com
时空大数据与社会感知研究组
新闻动态
当前位置: 中文主页 >> 新闻通知 >> 新闻动态

加州圣地亚哥州立大学Li An教授做“时空数据挖掘”学术报告

发布时间:2019-11-25 点击次数:

2019年5月10日下午,美国加州圣地亚哥州立大学地理系的安力教授,应邀在北大遥感所做学术报告,题目是“Space-Time Data Mining: Theory, Methodology, and Applications”。刘瑜教授主持了本次报告过程。

安力教授首先从关于行星运动的开普勒第三定律入手,说明通过数据挖掘可以发现复杂天体运动背后的简单机理。其后,他介绍了“人与环境复杂系统”(Complex Human-Environment Systems)理论,指出该复杂系统具有反馈、非线性、涌现、自学习/适应、传奇性、异质性、等效性(Equifinality)和多效性(Multifinality)等特征。在观测该复杂系统时,通常有横截面、时间序列、时空面板三种数据组织形式。在进行具体分析时,根据是否考虑空间自相关,又可以将数据分为截面数据、面板数据、空间数据和空间面板数据四种类型。安力教授指出这四种数据类型是针对不同问题而产生的,并给出了相应的分析方法范例。

“人与环境复杂系统”的数据类型、分析方法及应用示例

在时空数据挖掘的应用方面,安力教授分别介绍了非洲加纳身体质量指数(BMI)、美国密歇根市土地变化、中国梵净山金丝猴保护三个具体案例。

在非洲加纳BMI研究中,安力教授旨在分析土地覆盖变量是否会影响BMI,并分析时空自相关的存在是否会对结果带来显著影响,采用的是潜在轨迹模型(Latent Trajectory Modeling, LTM)与特征向量空间滤波(Eigenvector Spatial Filtering, ESF)相结合的方法。首先假设所有分析单元的观测值均来自于同一个潜在轨迹,然后将轨迹参数(截距、斜率、斜率平方)与通过ESF提取的特征向量进行建模。通过多个模型对比后发现,在不同属性区域中,如果不采用ESF模型,则会忽略某些显著且重要的规律。

在美国密歇根市土地变化研究中,安力教授旨在分析土地变化时间测度中的不确定性问题,采用了生存分析(Survival Analysis)方法。在记录土地变化时,通常会存在数据缺失等问题。借鉴疾病研究,安力教授采用生存分析方法刻画了土地利用在不同时间节点的转变概率。通过模型对比后发现,在考虑了数据的左截、右截和中截特征后,能够发现与其它传统模型结果显著不同的变量关系。

在中国梵净山金丝猴保护研究中,安力教授旨在揭示人与环境之间的复杂作用机制,采用智能体模型(Agent-based model)进行分析。通过问卷、访谈等手段,获取退耕还林/草政策对居民行为选择的影响,并采用离散选择模型进行定量建模;采用定点数字相机,来观测猴子、居民和游客的时空行为。以此为基础,构建反映居民、猴子时空行为及其交互作用的多智能体模型,并通过设置不同的情景,来评估不同政策措施的影响效果。

最后,安力教授回顾了智能体模型研究的时间变化,发现相关论文和作者数量在过去二十年间呈现出指数级增长,并探讨了在大数据时代采用自下而上的方法建立大尺度人与环境复杂系统模拟的计算科学的广阔前景。

学术报告结束后,参会师生针对空间滤波模型、智能体模拟参数标定和结果验证、分析单元选取等问题,与安力教授进行了半个多小时的交流。讨论结束后,团队部分老师与安力教授合影留念。