主 题:Ranking Inferences Based on the Top Choice of Multiway Comparisons基于多项选择中的首选项进行排序推断
主讲人:普林斯顿大学范剑青教授
主持人:统计学院林华珍教授
时间:2024年7月16日(周二)上午12:00-13:00
举办地点:柳林校区弘远楼408会议室
主办单位:统计研究中心和统计学院 国际交流与合作处 科研处
主讲人简介:
范剑青教授是一位统计学家、金融计量经济学家和数据科学家,现任美国普林斯顿大学 Frederick L. Moore'18 冠名金融学、统计与数据科学、和运筹与金融工程讲座教授, 统计与数据科学实验室和金融工程实验室主任。他于 2005-2017 年任普林斯顿大学统计研究委员会主任,于 2012至 2015 年任运筹与金融工程系主任。
范剑青教授在国际学术界享有极高声誉。他合著了 4 本备受推崇的书籍和 300多篇高被引用的论文。他于 2000 年获国际统计学领域最高奖项 COPSS 奖,2006 年获洪堡基金会终身成就奖,2007 年获晨兴华人数学家大会应用数学金奖,2009年获得在美国文理与艺术界著名的 GUGENHEIM Fellow, 2013 年获泛华统计学会首届“许宝禄奖”,2014 年获英国皇家统计学会的“Guy Medal”银质奖章,2018年美国统计学会的 Noether 杰出学者奖,2021 获国际数理统计学会的 Le Cam 奖与讲座,2011 和 2023 年做国际数理统计学会的Medallion 报告和 LetCam 讲座,2023年当选为比利时皇家科学院院士。
范剑青教授于 2008 年当选国际数理统计学会(IMS)主席,2009 年当选国际泛华统计学会(ICSA)主席。他还当选美国科学促进会(AAAS)、美国统计学会 (ASA)、国际数理统计学会 (IMS)的会士以及国际统计研究会(ISI)的 elected member。
范剑青教授在非参数建模、高维统计、机器学习、网络分析、深度学习、数
据科学、金融经济学和生物信息学等做出基础性贡献,成果大多发表在《Annals of Statistics》, 《Journal of American Statistical Association》,《Journal of Royal Statistical society series B》,《Proceedings of the National Academy of Sciences》, 《Econometrica》, 《Journal of Financial Economics》, 《Journal of Finance》,《Journal of Econometrics》等国际顶尖期刊上。此外,范剑青还先后担任《Probability Theory and its Related Fields》, 《Annals of Statistics》, 《Journal of Econometrics》, 《Journal of Business and Economics Statistics 》 , 《 Journal of American Statistical Association》等多个国际顶尖概率、统计、计量等期刊杂志的共同主编。
内容简介:
This paper considers ranking inference of n items based on the observed data on the top choice among M randomly selected items at each trial. This is a useful modification of the Plackett-Luce model for M-way ranking with only the top choice observed and is an extension of the celebrated Bradley-Terry-Luce model that corresponds to M = 2. Under a uniform sampling scheme in which any M distinguished items are selected for comparisons with probability p and the selected M items are compared L times with multinomial outcomes, we establish the statistical rates of convergence for underlying n preference scores using both l2-norm and l∞-norm, with the mini- mum sampling complexity. In addition, we establish the asymptotic normality of the maximum likelihood estimator that allows us to construct confidence intervals for the underlying scores. Furthermore, we propose a novel inference framework for ranking items through a sophisticated maximum pairwise difference statistic whose distribution is estimated via a valid Gaussian multiplier bootstrap. The estimated distributions are then used to construct simultaneous confidence intervals for the differences in the preference scores and the ranks of individual items. They also enable us to address various inference questions on the ranks of these items. Extensive simulation studies lend further support to our theoretical results. A real data application convincingly illustrates the usefulness of the proposed methods.
(Joint work with Zhipeng Lou, Weichen Wang, and Mengxin Yu)
本文研究在每次试验中基于随机选择的M个项目的首选项观测数据对n个项目进行排序推断。这是对Plackett-Luce模型的一种有效修改,适用于只观察到首选项的M项排名情况,并且是著名的Bradley-Terry-Luce模型(对应于M = 2)的扩展。在均匀采样方案下,任何M个精选项目以概率p被选择并进行比较,主讲人紧接着对所选的M个项目以多项分布结果进行L次比较,通过最小采样复杂度,使用l2-范数和l∞-范数建立了底层n个偏好分数的统计收敛率。此外,主讲人还建立极大似然估计的渐近正态性,进而为底层得分构建置信区间。我们进一步提出了一种新颖的推断框架,通过复杂的最大成对差异统计量进行排推断,并通过有效的高斯乘法自助法估计其分布。估计的分布用于构建偏好得分差异和个别项目排名的同时置信区间。它们还使主讲人能够解决有关这些项目排名的各种推断问题。广泛的模拟研究进一步支持主讲人的理论结果,真实数据有力地说明主讲人所提出方法的实用性。
(Joint work with Zhipeng Lou, Weichen Wang, and Mengxin Yu)