北京大学官网北京大学新闻网 English
马萌
点赞:
马萌
点赞:
研究方向
分布式系统的自动化故障诊断分析

研究成果1: 基于因果关联分析与挖掘,提出一种利用多模态的性能监控数据(时延、吞吐、CPU、内存、可用性等)对分布式系统的异常传播进行发现和重构的技术,可实现在不依赖任何系统知识的情况下生成系统故障的传播图


研究成果2: 提出自动化的故障模式学习技术,建立了传播图上的多种运算,实现了节点和故障特征的自主学习,使算法能够根据故障情景主动提高检测精度


研究成果3: 提出基于二阶随机游走的故障溯源算法,高效的实现了高可解释性的故障链发现以及准确的故障根因发现