查看原文
其他

沙龙回顾 | 王汉生:疫情防控中的统计学问题

光华BA 北大光华商业分析 2021-09-15
 PKUGSM BUSINESS ANALYTICS 

2020年9月27日上午,北京大学光华管理学院2020级商业分析硕士班学术沙龙委员会举办了秋季学期的第一场线下沙龙,活动邀请到北大光华商务统计与经济计量系王汉生教授为同学们带来了主题为“疫情防控中的统计学问题”的学术专题分享。

1

卫健委公告中统计口径问题



首先,王汉生教授从采集疫情相关数据过程中的几个例子引出了这个话题:不同地方发布的公告并不相同,比如一些地方的卫健委公告了累计确定密切接触者,一些地方的卫健委却没有汇报;湖北省开始没有公告临床诊断病例,后来又将其加入。同样是国家卫健委,有时候报告的是累计报告疑似病例,有时候报告的是现有疑似病例等。


由此可见,数据指标在最底层的采集,在我们国家现在可能都是一个问题。如果指标本身的统计口径前后涉及到这么巨大的变化,将来再去研究它,数据质量就非常难以保证

2

回归分析思维的普遍缺乏


这一部分,王汉生教授主要强调的是我们在整个公共卫生安全的治理过程中,回归分析思维能力的缺乏。



回归思维就是能快速地看到想解决的业务问题或者产品跟数据之间的关系。王汉生教授指出,网络上所流传的“新型冠状病毒感染自测评估”的问卷背后,并没有回归模型的支撑。中国疾病预防控制中心所做的《新型冠状病毒肺炎流行病学特征分析》以描述统计为主,如果能加入回归模型,可能会更好一些。比如若将严重程度作为Y变量,年龄、性别等作为X变量,建立回归模型,则可以预测收治的病人里面,哪些可能会发展到比较严重,哪些可能是比较轻的。同时,王汉生教授还提到诊断标准中影像特征特别依赖于人的判断的问题,这也是需要改进的地方。而云南省则提供了一个宝贵的成功案例,利用现有数据构造了朴素贝叶斯模型。



接下来,王汉生教授指出,“R0”(再生指数)与“拐点”是两个被过度关注的指标,而“尚在医学观察的密切接触者”(尚在医学观察的密切接触者 = 累计追踪到的密切接触人数 - 累计已解除医学观察的密切接触人数)这一不被一般大众关注的数据则非常重要。比如,一个地区是否应该复工,核心标准也许不应该是某种拐点,而当“尚在医学观察的密切接触者”这个数字降下来。


此外,王汉生教授还介绍了我国学者在统计学和生物统计顶级期刊的学术发表情况。北京大学生物统计系是国内唯一一个由数学科学学院和医学及公共卫生学院共建的生物统计系,在未来,无论是从对统计学的方法论的改善,还是对我国医学研究改革可能都会有不错的贡献。最后,王汉生教授就同学提出的问题进行了解答。


王汉生,北京大学光华管理学院商务统计与经济计量系,嘉茂荣聘讲席教授,博导,系主任。北京大学商务智能研究中心、主任。数据科学微信公众号“狗熊会”创始人。致力于商务统计学的理论研究与产业实践。1998年北京大学数学学院概率统计系本科毕业,2001年美国威斯康星大学麦迪逊分校统计系博士毕业。2003年加入光华至今。



持续关注北大光华商业分析

第一时间掌握项目信息

长按“上图”识别二维码,关注北大光华商业分析 

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存