• 统计研究中心
当前位置: 首页 > 系列讲座 > 正文

美国加州大学河滨分校 马舒洁教授:Determining the number of communities in degree-corrected stochastic block models

光华讲坛——社会名流与企业家论坛第5509期

主题:Determining the number of communities in degree-corrected stochastic block models

主讲人:美国加州大学河滨分校 马舒洁教授

主持人:统计学院统计研究中心 周岭副教授

时间:2019年8月1日上午10:30-11:30

地点:西南财经大学柳林校区弘远楼408会议室

主办单位:统计研究中心 统计学院 科研处

主讲人简介:

马舒洁教授于2011年在美国密西根州立大学获得统计学博士学位。现为美国加州大学河滨分校终身教授、副教授。担任Journal of Business & Economic Statistics 和Statistica Sinica 等多个统计类国际学术期刊的副主编(Associate Editor)。她目前的主要研究方向包括大规模数据分析,精准医疗,高维数据分析,纵向数据分析及在环境风险估测,营养学,医药学和金融学的统计方法应用。先后在统计学和经济学国际期刊上发表三十余篇学术论文。

主要内容:

We propose to estimate the number of communities in degree-corrected stochastic block models based on a pseudo likelihood ratio. For estimation, we consider a spectral clustering together with binary segmentation method. This approach guarantees an upper bound for the pseudo likelihood ratio statistic when the model is over-fitted. We also derive its limiting distribution when the model is under-fitted. Based on these properties, we establish the consistency of our estimator for the true number of communities. Developing these theoretical properties require a mild condition on the average degree -- growing at a rate of log(n), where n is the number of nodes. Our proposed method is further illustrated by simulation studies and analysis of real-world networks. The numerical results show that our approach has satisfactory performance when the network is sparse and/or has unbalanced communities.

我们提出了一种基于伪似然比来估计度校正随机块模型中群体数量的方法。我们考虑将谱聚类和二值分割方法相结合来对该方法进行估计。该估计方式保证了模型过拟合时伪似然比统计量存在上界。我们进一步推导了模型拟合不足时的极限分布。基于这些性质,我们得到了真实群体数量估计量的一致性。这些理论性质需要一个相对宽松的条件——以log(n)的速度增长,其中n是节点的数量。我们通过对实际网络的仿真研究和分析,进一步说明了该方法的有效性。数值结果表明,该方法在网络稀疏或群体分布不平衡的情况下具有较好的性能。


上一条:微软亚洲研究院高级研究员陈薇博士:Optimization, Generalization, and Out-of-distribution Prediction in Deep Learning

下一条:加州大学戴维斯分校彭捷教授:纤维束方向分布函数估计及其在使用HCP D-MRI数据研究脑侧化中的应用