光华讲坛——社会名流与企业家论坛第5423期
主题:Semi-parametric inference for large-scale data with non-stationary non-Gaussian temporally dependent noises
主讲人:中国科学院数学与系统科学研究院 陈敏研究员
主持人:统计学院 林华珍教授
时间:2019年6月7日(星期五)下午13:30-14:30
地点:西南财经大学柳林校区弘远楼408会议室
主办单位:统计研究中心 统计学院 科研处
主讲人简介:
陈敏,中国科学院数学与系统科学研究院二级研究员,博士生导师。现任中国科学院政府行政管理系统分析研究中心主任。全国统计方法应用技术标准化委员会主任委员,《数理统计与管理》主编,《应用数学学报(中文版)》副主编,《中医药现代化》编委。中国数学学会副理事长、中国统计教育学会副会长、北京大数据协会副会长。曾任中国科学院数学与系统科学研究院任副院长,享受国务院政府特殊津贴。主要研究方向为:金融统计理论与方法、非线性时间序列的统计分析,非参数统计估计和检验的大样本理论,生物统计的理论和方法,应用统计(工业统计、统计标准化、财税信息技术),大数据分析与处理的统计理论与算法研究。出版和翻译教材和专著7部;在国内外核心学术期刊发表统计理论与应用、经济、金融和管理科学论文130余篇,其中SCI和EI论文90余篇。
主要内容:
Non-stationarity, non-Gaussianity and temporal dependence are commonly encountered in large-scale structured data, emerging from scientific studies in neuroscience and meteorology among others. These challenging features may not fit into existing theoretical framework or data analysis tools. Motivated from the multi-scan multi-subject fMRI data analysis, this paper proposes a new semi-parametric inference procedure applicable to a broad class of “non-stationary non-Gaussian temporally dependent” noise processes for time-course data collected at spatial points. A new test statistic is developed based on a tapering-type estimator of the large-dimensional noise auto-covariance matrix, and its asymptotic chi-squared distribution is established. Our method benefits from avoiding directly inverting the noise covariance matrix without reducing efficiency, adaptive to either stationary or a wide class of non-stationary noise processes, thus is particularly effective in dealing with practically challenging cases arising from very large-scales of data and large-dimensions of covariance matrices. The efficacy of the proposed procedure over existing methods is demonstrated through simulation evaluations and real fMRI data analysis.
在处理从神经科学和气象学等研究中产生的大规模结构化数据时,我们经常会发现数据呈现非平稳性、非高斯性以及噪声的时变性。现有的理论框架或数据分析工具对于这些具有挑战性的特性可能不适合。本文从多次扫描多个目标的fMRI数据分析出发,提出了一种适用于广泛的“非平稳非高斯时变噪声”过程处理的半参数推断方法,用于空间-时间过程数据的处理。基于大维噪声自协方差矩阵的估计,提出了一种新的检验统计量,并建立了其渐近卡方分布。我们的方法能够避免直接对噪声协方差矩阵求逆,同时不降低效率,适用于平稳或广泛的非平稳噪声过程,因此能够有效地处理由大规模数据和大维协方差矩阵引起的计算与理论问题。通过仿真和实际fMRI数据分析,对比现有方法验证了我们提出的方法的有效性。