• 统计研究中心
当前位置: 首页> 系列讲座> 正文

中国人民大学郭绍俊副教授:Regularization for High Dimensional Functional Data: Functional Thresholding and Fast Computation

光华讲坛——社会名流与企业家论坛第6245期


主 题:Regularization for High Dimensional Functional Data: Functional Thresholding and Fast Computation

讲人:中国人民大学郭绍俊副教授

主持人:统计学院林华珍教授

时间:2022年10月26日(周三)上午10:30-11:30

直播平台及会议ID:腾讯会议,174-303-444

主办单位:统计研究中心和统计学院 科研处


主讲人简介:

郭绍俊,现为中国人民大学统计与大数据研究院长聘副教授。2003年本科毕业于山东师范大学,2008年获得中国科学院数学与系统科学研究院理学博士学位。2008-2016年在中国科学院数学与系统科学研究院工作,任助理研究员。2009-2010年赴美国普林斯顿大学运筹与金融工程系博士后研究,做高维数据分析方面的研究工作,并于2014-2016年在英国伦敦经济学院统计系做博士后研究,做大维时间序列建模方面的研究。目前主要研究方向有:统计学习;非参数及半参数统计建模;生存分析及函数型数据分析等。

内容提要:

Covariance function estimation is a fundamental task in multivariate functional data analysis and arises in many applications. In this talk, we consider estimating sparse covariance functions for high-dimensional functional data, where the number of random functions p is comparable to, or even larger than the sample size n. Aided by the Hilbert--Schmidt norm of functions, we introduce a new class of functional thresholding operators that combine functional versions of thresholding and shrinkage, and propose the adaptive functional thresholding estimator by incorporating the variance effects of individual entries of the sample covariance function into functional thresholding.

To handle the practical scenario where curves are partially observed with errors, we also develop a nonparametric smoothing approach to obtain the smoothed adaptive functional thresholding estimator and its binned implementation to accelerate the computation. We investigate the theoretical properties of our proposals when p grows exponentially with n under both fully and partially observed functional scenarios. Finally, we demonstrate that the proposed adaptive functional thresholding estimators significantly outperform the competitors through extensive simulations and the functional connectivity analysis of two neuroimaging datasets.

协方差函数估计是多元函数数据分析中的一项基本任务,在许多应用中都有涉及。在这次演讲中,我们考虑估计高维泛函数据的稀疏协方差函数,其中随机函数的数量p与样本容量n相当,甚至大于样本容量n。在函数的HilbertSchmidt范数的帮助下,我们引入了一类新的泛函阈值算子,它结合了泛函版本的阈值和收缩。并提出了将样本协方差函数各分量的方差效应纳入函数阈值的自适应函数阈值估计方法。针对实际情况下曲线部分观测存在误差的情况,我们还提出了一种非参数平滑方法来获得平滑的自适应函数阈值估计量,并将其进行了分类实现,以加快计算速度。在完全和部分观察到的函数场景下,当pn呈指数增长时,我们研究了我们提出的理论性质。最后,通过对两个神经成像数据集的大量模拟和功能连通性分析,我们证明了提出的自适应功能阈值估计器显著优于竞争对手。



上一条:北京大学艾明要教授:Optimal Distributed Subsampling Techniques for Big Data Analysis

下一条:宾夕法尼亚大学苏炜杰副教授:Gaussian Differential Privacy and Some Computational Challenges