主题:Regression Analysis of Interval-Censored Failure Time Data with Random Change Point and Application to Breast Cancer Study 带有随机变点的区间删失失效时间数据回归分析及其在乳腺癌研究中的应用
主讲人:南方科技大学理学院统计与数据科学系孙建国教授
主持人:统计与数据科学学院陈雪蓉教授
时间:2026年4月29日(周三)下午4:00-5:00
地点:柳林校区弘远楼408会议室
主办单位:统计与数据科学学院和统计研究中心 科研处
主讲人简介:
孙建国,南方科技大学统计与数据科学系教授。曾任美国密苏里大学杰出(Curator's Distinguished)教授 ,博士生导师,美国统计协会Fellow、国际数理统计协会Fellow,国际统计学会Elected Member。目前,他是Statistics in Biosciences期刊主编。另外,他曾担任国际泛华统计协会(ICSA)主席、美国统计学会(ASA)生存分析(Lifetime Data Science)分会主席,现在或曾经担任Journal of the American Statistical Association, Statistics in Medicine, Lifetime Data Analysis, The International Journal of Biostatistics, Computational Statistics & Data Analysis等12个国际顶级统计期刊副主编、期刊编委。孙教授共指导了50多名博士生和博士后。主要研究方向包括函数型数据分析,生物医学统计,缺失数据分析等。主要从事生物统计,基因数据分析,复杂数据建模方法及其在临床医学、金融和社会学等领域内的应用,在区间删失失效时间数据分析,面板计数数据分析,双重删失数据分析、纵向数据分析,以及艾滋病和癌症研究等方面做出了重要贡献。他出版发表了这两个领域内第一本著作,并另外编辑了两本关于区间删失失效时间数据分析的书籍,在JASA, JRSSB, Biometrika,Annual of Statistics, Biometrics, Statistica Sinica, Statistics in Medicine等具有国际影响力的顶级学术期刊发表论文近300篇,受邀给了200余次短期讲座和学术报告。 孙教授主持或参与美国卫生部(National Institutes of Health)和国家自然科学等基金(NSF)29项(主持16项),多次组织大型国际统计会议。
内容提要:
In this talk, we will discuss regression analysis of interval-censored failure time data when there exist random change points with the focus on variable selection. Such data can occur in, for example, clinical trials where the risk of a disease may dramatically change when some biological indexes of the human body exceed certain thresholds. For the problem, we will first present a class of linear transformation change point models and develop a sieve maximum likelihood estimation procedure. Then a penalized method will be proposed for simultaneous estimation and variable selection, and the asymptotic properties of the proposed method are established. A simulation study is conducted and indicates that the proposed methods work well in practical situations. The approaches are applied to a set of real data from a breast cancer study.
在本报告中,主讲人将讨论存在随机变点时区间删失失效时间数据的回归分析,重点关注变量选择问题。这类数据常见于临床试验等场景,例如当人体某些生物指标超过特定阈值时,疾病风险可能发生显著变化。针对该问题,主讲人首先提出一类线性变换变点模型,并发展相应的筛最大似然估计方法。随后,主讲人将提出一种用于同时进行估计和变量选择的惩罚方法,并建立所提方法的渐近性质。通过模拟研究验证了所提方法在实际场景中的良好表现。最后,主讲人将所提出的方法应用于一项乳腺癌研究的真实数据。