光华讲坛——社会名流与企业家论坛第 5760 期
(线上讲座)
主题:Statistical Inference on Membership Profiles in Large Networks
主讲人:普林斯顿大学范剑青教授
主持人:统计学院 林华珍教授
时间:2020年7月20日(周一)上午10:00-11:00
直播平台及会议ID:ZOOM,421 568 770
主办单位:统计研究中心、数据科学与商业智能联合实验室和统计学院 科研处
主讲人简介:
范剑青, 统计学家,金融计量经济学家和数据科学家。范剑青是美国普林斯顿大学终身教授,运筹与金融工程系教授和前任系主任,国际数理统计学会和国际泛华统计学会前主席,“中央研究院”院士。
2000 年荣获COPSS 总统奖,该奖为国际统计学领域的最高奖,被誉为统计学菲尔兹奖;1996 年获北卡罗莱纳大学 Hettleman 艺术与学术成就奖;2002 年获香港中文大学校长模范教学奖;2006 年荣获洪堡基金会的终身成就奖;2007 年荣获”晨兴华人数学家大会应用数学金奖”,该奖被誉为华人数学界的最高奖;2008 年获泛华统计学会授予的杰出成就奖;2009 年获得在美国文理与艺术界著名的 GUGENHEIM Fellow; 2013 年获得泛华统计学会首次颁发的许宝禄奖,该奖颁发给不超过 50 岁的优秀统计学家,三年一次;2014 年荣获英国皇家统计学会的 Guy 银奖,该奖每年一次,是继该学会三年一次的金奖之后的最高荣誉;2018 年荣获美国统计学会的诺瑟尔高级学者奖 (Noether Senior Scholar Award)。
此外,他还是美国科学促进会(AAAS)、美国统计学会 (ASA)、国际数理统计学会 (IMS) 的会士以及国际统计研究会(ISI)的 elected member;《Journal of Business and Economics Statistics商务与经济统计》的主编, 《Management Science》、 《Statistical Surveys》和《Science in China, Series A》的Associate Editor。曾担任AoS、JoE等的Editor以及JASA、中国科学等的Associate Editor。
他的主要研究兴趣为大数据、计量金融、金融工程、机器学习、高维统计、时间序列、非参数建模等。
详情请见其个人主页:https://orfe.princeton.edu/~jqfan/
内容提要:
Network data is prevalent in many contemporary big data applications in which a common interest is to unveil important latent links between different pairs of nodes. The nodes can be broadly defined such as individuals, economic entities, documents, or medical disorders in social, economic, text, or health networks. Yet a simple question of how to precisely quantify the statistical uncertainty associated with the identification of latent links still remains largely unexplored. In this talk, we suggest the method of statistical inference on membership profiles in large networks (SIMPLE) in the setting of degree-corrected mixed membership model, where the null hypothesis assumes that the pair of nodes share the same profile of community memberships. In the simpler case of no degree heterogeneity, the model reduces to the mixed membership model and an alternative more robust test is proposed. Under some mild regularity conditions, we establish the exact limiting distributions of the two forms of SIMPLE test statistics under the null hypothesis and their asymptotic properties under the alternative hypothesis. Both forms of SIMPLE tests are pivotal and have asymptotic size at the desired level and asymptotic power one. The advantages and practical utility of our new method in terms of both size and power are demonstrated through several simulation examples and real network applications.
(Joint work with Yingying Fan, Xiao Han and Jinchi Lv)
网络数据在许多当代大数据中应用广泛,其中一个共同的兴趣是揭示不同节点对之间的重要潜在链接。可以在社会,经济,文本或健康网络中广泛定义节点,例如个人,经济实体,文档或医学疾病。然而,如何精确量化与潜在链接的识别相关的统计不确定性的简单问题仍在很大程度上尚未探究。在本次演讲中,我们提出在度校正混合成员模型的SIMPLE方法,其中零假设假设这对节点共享相同的社区成员身份配置文件。在没有度数异质性的较简单情况下,该模型简化为混合隶属度模型,并提出了另一种更健壮的测试。在一些适度的规律性条件下,我们建立了两种在原始假设下的SIMPLE检验统计量的精确极限分布,以及在替代假设下的渐近性质。两种形式的SIMPLE测试都是关键性的,并具有所需水平的渐近大小和渐近幂。通过几个仿真示例和实际网络应用,证明了我们的新方法在大小和势方面的优点和实用性。
(这是与Yingying Fan, Xiao Han and Jinchi Lv共同完成的)