• 统计研究中心
当前位置: 首页> 系列讲座> 正文

美国亚利桑那大学张灏教授: Scalable and Model-free Methods for Multiclass Probability Estimation

光华讲坛——社会名流与企业家论坛第 5746 期

(线上讲座)

主题Scalable and Model-free Methods for Multiclass Probability Estimation

主讲人美国亚利桑那大学张灏教授

主持人统计学院 林华珍教授

时间2020年7月8日(周三)上午10:30-11:30

直播平台及会议ID腾讯会议,293 131 499

主办单位:统计研究中心、数据科学与商业智能联合实验室、统计学院、科研处

主讲人简介:

张灏,美国亚利桑那大学数学系教授,数理统计学会(IMS) Fellow,国际统计学会(ISI)Elected Member, 美国统计学会 (ASA) Fellow。本科毕业于北京大学数学专业,2002年获得美国威斯康大学麦迪逊分校统计学博士学位,曾任职于北卡罗莱那州州立大学统计系终身教授。研究领域包括非参数统计,高维数据分析和模型选择,统计机器学习。目前担任国际统计学会 (ISI) 杂志Stat主编,以及JASAJRSS-B等多项国际统计学核心期刊副主编。2007年获美国国家自然科学基金杰出青年成就奖 (NSF Career Award)2019年特邀IMS Medallion Lecturer。详情请见其个人主页:https://www.math.arizona.edu/~hzhang/


内容提要:

Classical approaches for multiclass probability estimation are mostly model-based, such as logistic regression or LDA, by making certain assumptions on the underlying data distribution. We propose a new class of model-free methods to estimate class probabilities based on large-margin classifiers. The method is scalable for high-dimensional data by employing the divide-and-conquer technique, which solves multiple weighted large-margin classifiers and then constructs probability estimates by aggregating multiple classification rules. Without relying on any parametric assumption, the estimates are shown to be consistent asymptotically. Both simulated and real data examples are presented to illustrate performance of the new procedure.

经典的多类概率估计方法大多是基于模型的,如logistic回归或LDA,通过对数据的潜在分布进行一定的假设。我们提出了一类新的基于大边缘分类器并与模型无关的估计类概率的方法。该方法采用divide-and-conquer的方法使高维数据具有可度量性,该方法解决了多个加权大边距分类器,然后通过聚合多个分类规则来构造概率估计。在不依赖任何参数假设的情况下,证明了估计是渐近一致的。文中给出了仿真和实际数据实例,以说明新方法的性能。


上一条:加州大学河滨分校李业华教授: Spatially Dependent Functional Data: Covariance Estimation, Principal Component Analysis, and Kriging

下一条:密西根大学何旭铭教授:How Good is Your Best Selected Subgroup(你选到的最好亚组到底有多好)?