• 统计研究中心
当前位置: 首页 > 正文

密歇根大学李颐教授:Inference for Deep Neural Network Estimators in Generalized Nonparametric  Models广义非参数模型下深度神经网络估计量的统计推断

主  题:Inference for Deep Neural Network Estimators in Generalized Nonparametric

Models广义非参数模型下深度神经网络估计量的统计推断

主讲人:密歇根大学李颐教授

主持人:统计与数据科学学院林华珍教授

时间:20251215日(周一)下午400-500

地点:柳林校区弘远楼408会议室

主办单位:统计与数据科学学院和统计研究中心 国际交流与合作处 科研处


主讲人简介:

李颐教授,现任美国密歇根大学公共卫生学院生物统计学系教授、M. Anthony Schork 讲席教授,并担任公共卫生学院中国项目主任及全球统计核心中心联合主任。他是国际知名的生物统计学家,在生存分析、高维数据、测量误差模型、空间统计及统计遗传学等领域做出了重要贡献。他的研究致力于发展面向复杂生物医学数据的创新统计方法,特别聚焦于存在删失、测量误差、高维协变量与空间相关性的建模问题。其方法论成果广泛应用于癌症预后、肾脏疾病、呼吸系统健康及传染病研究等重要公共卫生与临床领域。他已在国际顶尖统计学期刊发表论文270余篇,包括 Journal of the American Statistical AssociationBiometrikaBiometrics 等。他的学术成果被广泛引用(Google Scholar 引用19316次,h指数60i10指数 183

内容提要:

While deep neural networks (DNNs) are used for prediction, inference on DNN-estimated subject-specific means for categorical or exponential family outcomes remains underexplored. We address this by proposing a DNN estimator under generalized nonparametric regression models (GNRMs) and developing a rigorous inference framework. Unlike existing approaches that assume independence between estimation errors and inputs to establish the error bound, a condition often violated in GNRMs, we allow for dependence and our theoretical analysis demonstrates the feasibility of drawing inference under GNRMs. To implement inference, we consider an Ensemble Subsampling Method (ESM) that leverages U-statistics and the Hoeffding decomposition to construct reliable confidence intervals for DNN estimates. We show that, under GNRM settings, ESM enables model-free variance estimation and accounts for heterogeneity among individuals in the population.

Through simulations under nonparametric logistic, Poisson, and binomial regression models, we demonstrate the effectiveness and efficiency of our method.

We further apply the method to the electronic Intensive Care Unit (eICU) dataset, a large scale collection of anonymized health records from ICU patients, to predict ICU readmission risk and offer patient-centric insights for clinical decision making.

深度神经网络(DNN)虽在预测任务中表现卓越,但其在分类与计数等复杂结局建模中的统计推断问题——尤其是对个体化预测值的不确定性量化——仍鲜有系统研究。为此,主讲人提出一种面向广义非参数回归模型(GNRM) 的DNN推断框架,突破传统方法中误差与输入独立这一不切实际的假设,允许二者存在依赖关系,从而在更广泛的真实场景下实现理论严密的统计推断。

本研究进一步提出集成子抽样方法(ESM),基于U统计量与Hoeffding分解,为DNN预测结果构建稳健的置信区间,不仅能实现无模型假设的方差估计,还可捕捉人群中的异质性信息。

通过一系列模拟实验(涵盖逻辑、泊松、二项等非参数回归模型),该方法表现出良好的有限样本性质与计算效率。主讲人将此框架应用于电子重症监护病房(eICU)大规模临床数据集,对ICU再入院风险进行预测与推断,从而为临床决策提供可解释、个体化的风险量化工具,助力精准医疗的发展。


下一条:新加坡国立大学董润桢教授:Industrial & Systems Engineering: From Practice to Theory工业与系统工程:从实践到理论