• 统计研究中心
当前位置: 首页 > 系列讲座 > 正文

大连理工大学李长城教授:因果图学习及其在流行病学中的应用

光华讲坛——社会名流与企业家论坛第 期

主 题因果图学习及其在流行病学中的应用

主讲人大连理工大学李长城教授

主持人统计学院林华珍教授

时间:2023年4月7日(周五)下午3-4点

报告地点:腾讯会议,815-653-515

主办单位:统计研究中心和统计学院 科研处

主讲人简介:

李长城,大连理工大学数学科学学院教授。本科就读于北京大学数学科学学院,获得统计学学士学位;博士阶段师从美国宾夕法尼亚州州立大学统计系李润泽教授,进行高维统计领域的学习,获得统计学博士学位。研究兴趣主要包括高维统计推断及高维因果推断。在高维统计的理论、应用以及计算方面进行了一系列研究,文章发表于一流学术期刊Journal of American Statistical Association、Journal of Econometrics、Annals of Applied Statistics、Statistica Sinica等,入选国家级青年人才计划。


内容简介

The Population-based HIV Impact Assessment (PHIA) is an ongoing project that conducts nationally representative HIV-focused surveys for measuring national and regional progress toward UNAIDS’90-90-90 targets, the primary strategy to end the HIV epidemic. We believe the PHIA survey offers a unique opportunity to better understand the key factors that drive the HIV epidemics in the most affected countries in sub-Saharan Africa. In this article, we propose a novel causal structural learning algorithm to discover important covariates and potential causal pathways for 90-90-90 targets.

Existing constrained-based causal structural learning algorithms are quite aggressive in edge removal. The proposed algorithm preserves more information about important features and potential causal pathways. It is applied to the Malawi PHIA (MPHIA) data set and leads to interesting results. We further compare and validate the proposed algorithm using BIC and using Monte Carlo simulations, and show that the proposed algorithm achieves improvement in true positive rates in important feature discovery over existing algorithms.

以人口为基础的艾滋病毒影响评估(PHIA)是一个持续进行的项目,它以全国为重点进行具有代表性的艾滋病毒调查,以衡量国家和区域在实现联合国艾滋病规划署的90-90-90目标方面取得的进展,该目标是结束艾滋病毒流行的主要战略。主讲人认为PHIA的调查提供了一个独特的机会,可以更好地了解在撒哈拉以南非洲受影响最严重的国家推动艾滋病毒流行的关键因素。在本文中,主讲人提出了一种新的因果结构学习算法,用于发现90-90-90目标的重要协变量和潜在因果路径。

现有的基于约束的因果结构学习算法在边缘去除方面具有很强的侵略性。提出的算法保留了更多关于重要特征和潜在因果路径的信息。它被应用于马拉维PHIA (MPHIA)数据集,并导致有趣的结果。主讲人进一步使用BIC和蒙特卡洛模拟对所提出的算法进行了比较和验证,并表明所提出的算法在重要特征发现的真阳性率方面比现有算法有所提高。


上一条:圣母大学LIU FANG教授: Recent advanaces in differentially private data synthesis, statistical learning, and machine learning

下一条:北京大学艾明要教授:Optimal Distributed Subsampling Techniques for Big Data Analysis