光华讲坛——社会名流与企业家论坛第 5836 期
主 题:Learning Optimal Dynamic Treatment Regimes under Risk Constraints
主讲人:北卡罗来纳大学教堂山分校刘玉峰教授
主持人:统计学院林华珍教授
时间:2021年6月15日(周二)上午10:30-11:30
直播平台及会议ID:zoom会议,ID: 956 1196 5684,密码:943162
主办单位:统计研究中心和统计学院 科研处
主讲人简介:
刘玉峰现任美国北卡罗来纳大学教堂山分校教授。主要研究方向包括统计机器学习,大数据分析,非参数统计,统计生物信息学。他发表了100多篇统计论文,担任过几个主要统计杂志的副主编。他是国际数理统计学会及美国统计协会的会士。
内容提要:
Supervised learning techniques have been widely used in diverse scientific disciplines such as biology, business, engineering, and neuroscience. In this talk, I will present new techniques for structured supervised learning problems. For the first part of the talk, we consider budget constraints in predictive modeling due to the high cost of collecting certain predictors in practice. We consider a new high-dimensional cost-constrained linear regression problem, that is, we aim to find the cost-constrained regression model with the smallest expected prediction error among all models satisfying a budget constraint. The non-convex budget constraint makes this problem NP-hard. In order to estimate the regression coefficient vector of the cost-constrained regression model, we propose a new discrete first-order continuous optimization method with theoretical guarantees. For the second part of the talk, we consider learning of multi-modality data with block-missing structure. A new technique effectively using all available data information without imputation will be discussed. Applications for the diabetes and Alzheimer's Disease Neuroimaging Initiative (ADNI) data will be used to illustrate the performance of the proposed methods.
监督学习技术已广泛应用于各种科学学科,如生物学、商业、工程和神经科学。在本次演讲中,我将介绍解决结构化监督学习问题的新技术。在演讲的第一部分,我们考虑了预测建模中的预算限制,因为在实践中收集某些预测变量的成本很高。我们考虑一个新的高维成本约束线性回归问题,即我们的目标是在所有满足预算约束的模型中找到预期预测误差最小的成本约束回归模型。非凸预算约束使这个问题变得很困难。为了估计成本约束回归模型的回归系数向量,我们提出了一种新的具有理论保证的离散一阶连续优化方法。在演讲的第二部分,我们考虑学习具有块缺失结构的多模态数据。将讨论一种有效利用所有可用数据信息而无需插补的新技术。糖尿病和阿尔茨海默病神经影像学倡议 (ADNI) 数据的应用将用于说明所提出方法的性能。