本
文
摘
要
最近,国家信息中心大数据发展部发布的一份报告,以#全国十大最堵三甲医院#为题登上了微博热搜。具体排名如下:
图片来源:一点新闻·沸点绝大多数人没机会在这么多城市分别体验医院服务,但“好医院真的很堵”却是每个人的共识。随着大多数医院全面使用BI系统,挂号(只要你别挂专家号)门诊诊疗取药这一条龙服务,已经不再是看病的卡脖子环节;相反的,在医院周围的拥堵和停车的绝望感,变成了最大的问题。
笔者曾有幸在上海华山医院周围工作。上班是绝对不敢开车的,开了堵死,通了绕死,停了贵死。不敢想象那些真患了急症,火急火燎驱车赶往医院的人会是什么心情。据说(未考,请有类似体验的人回答)上海有一些医院已经禁止本院职工开车上班,把停车位让给患者,实惨。
可是从这份榜单来看,数据让人忍不住吐槽:就这?就这?
可以看到,排名高居全国第一的河南人民医院拥堵指数只有2.82,堵到笔者害怕的上海华山医院只有2.62,而榜单第十的西安交大一院只有2.37,只略高于北京全市的平均拥堵指数。要知道,北京市再堵,它也有没那么堵的地方,这可是全市的平均水平啊!如果你根据这个表,跑去对北京人说,噫,沃北京全市都堵得跟交大医院周围似滴!或者对西安人说,嗨,这交大医院儿周围也就和北京一样儿堵!马上两边人都会跳起来揍你一顿。
为什么会这样呢?为什么从数据看来,各大医院周围一点都不堵呢?
首先,让我们从“拥堵指数”说起。
拥堵指数(congestion index)是用来分析城市交通情况的一个技术指标。目前,最常用的是拥堵延时指数,即城市居民平均一次出行实际旅行时间与自由状态下旅行时间的比值,一般在1-10之间。简单(但不准确,这种表述仅用于科普)来说,假设你开车回家,一路畅通的情况下要开1小时,而实际上开了2.5小时,我们就说这段路的拥堵指数为2.5。
我们平时也经常接触到拥堵指数,那就是在用导航的时候:导航软件给你显示的绿色、黄色、红色、暗红色道路,判定标准就是拥堵指数。
拥堵指数是动态的,会随着时间、车流情况而不断变化。为了让这些数据为决策服务,人们会忽略时间、具体道路的区别,直接取各时段各路段的数学平均值,得出每个城市的拥堵指数。上面的“全国十大最堵三甲医院”也是基于这套模型得出的。
2017年各城市拥堵指数排名显然,这套BI模型,对于越大的样本越有用。比如对于一个城市来说,大量的样本抹平了时段、路段波动的干扰,非常有参考价值。北京比上海堵,山城重庆超级堵,西安虽然经济比不了东部地区但堵到飞……这些我们直观感受到的印象,在数据中得到了完美的验证,很有参考价值。
但是,具体到一个小样本,这套BI模型就不好用了。三甲医院在这方面尤其严重,因为来大医院的人有极强的潮汐性,挂号只争朝夕,大部分人都集中在医院开始营业前后到达,就算在网上挂到下午的号,大部分人也会从上午开始坐在候诊室里静等。中午刚结束一般还有第二波高峰,等下午2点一过,还没来的人基本就不用来了,医院立刻冷清起来,交通也畅通了。晚上更不用说。
然而,决定“一间医院堵不堵”的,恰恰是那最堵的两个峰值。同样把堵点匀到全天24小时,整个城市的潮汐性远比一间医院小。拥堵指数,对城市很有参考价值,对医院就明显失真。
所以,单从数据看起来,“十大最堵医院”一点都不堵。考虑到每所医院的营业时间、医院诊疗速度、住院患者比例、网上挂号比例、外地患者比例等等诸多干扰项,甚至对医院之间横向对比,这项数据的参考意义也不太大。
交通拥堵,本身具有很强的随机性,很难找到一种完美的测算模型。但实际生活中,我们又的确很需要这项数据。比如,对于顶级三甲医院的领导来说,如果能有更准确的数据,就可以智能规划院内的车流导向,大大提高接诊效率。
为了更准确测算像医院这样,随机性、潮汐性特别强的小样本的拥堵指数,人们也研究了很多新的方法。比如笔者比较喜欢的一种,基于路段消散指数进行测算的方法。这种方法把道路拥堵的焦点从“聚”改为“散”,预计道路车流的消散时间,克服了只以浮动车车速定义交通拥堵指数的不足。这方面的研究还有很多,感谢这些研究者的付出,详情可以查阅相关文献。
总而言之,只有能够反映我们直观感受的数据,才是“真”数据。一个明显违背常识的数据,只能说明对数据的解读有问题。数据不会骗人,但整理数据的人会。国家权威部门发布这份榜单,全文是《2020Q2中国主要城市交通分析报告》,而媒体呢,只会把#全国十大最堵三甲医院#顶上你的热搜。