报告题目:Large-scale survival analysis with a cure fraction
报告人:孙六全研究员(中国科学院数学与系统科学研究院)
时 间:2024年11月17日(星期日)15:30-16:30
地 点:主教学楼F205
报告人简介:
孙六全,中国科学院数学与系统科学研究院二级研究员,博士生导师。现任中国现场统计研究会副理事长,全国工业统计学教学研究会副会长,北京应用统计学会副会长,中国统计教育学会高等教育分会副会长,中国现场统计研究会资源与环境统计分会理事长,全国工业统计教学研究会数字经济与区块链技术协会会长,中国统计学会常务理事,中国统计教育学会常务理事等。现为《数理统计与管理》主编,《中国大百科全书》第三版统计学科副主编,以及一些国内外期刊的编委。曾任中国概率统计学会副理事长,《中国科学,数学》等期刊编委,国际华人统计协会(ICSA)Program Committee Member和Membership Committee Co-Chair。主要研究方向为生存分析、生物统计、纵向数据和复发事件数据以及复杂删失数据的统计分析。在JASA,Biometrika,JMLR及JBES等国内外核心期刊发表学术论文180多篇。主持了国家自然科学基金重点项目1项,并先后主持或参与了973重大项目、国家自然科学基金重大项目、重点项目和面上项目等20项。
报告摘要:
With the advent of massive survival data with a cure fraction, large-scale regression for analyzing the effects of risk factors on a general population has become an emerging challenge. This article proposes a new probability-weighted method for estimation and inference for semiparametric cure regression models. We develop a flexible formulation of the mixture cure model consisting of the model-free incidence and the latency assumed by the semiparametric proportional hazards model. The susceptible probability assesses the concordance between the observations and the latency. With the susceptible probability as weight, we propose a weighted estimating equation method in a small-scale setting. Robust nonparametric estimation of the weight permits stable implementation of the estimation of regression parameters. A recursive probability-weighted estimation method based on data blocks with smaller sizes is further proposed, which achieves computational and memory efficiency in a large-scale or online setting. Asymptotic properties of the proposed estimators are established. We conduct simulation studies and a real data application to demonstrate the empirical performance of the proposed method.
科研管理处
计算科学与电子学院
2024年11月14日
欢 迎 广 大 师 生 参 加!
(审核:胡武平 田智鲲 肖松涛)