政府数字治理新赛道:电网如何生产用户“健康码”

2020-05-14 17:28   486次浏览

超级疫情时刻,健康码作为人手一份的政务应用,被视作数字时代全民协作的一次政府数字治理试验。事实上,健康码运行的机理,与电力等高频基础数据参与政府“散乱污”治理场景有异曲同工之处。

线上通过健康码对疫情进行“大排查”的基本思路是,收集公民自主申报的健康状况、旅居史、出行状况等动态信息,依照各地规则做初步判定和筛查。而后,公民将收到绿码、黄码或红码不同结果,或通行或隔离,以作为省际流动的健康凭证。

而“散乱污”治理场景中,根据官方定义,“散”未能按照要求进驻工业园区,“乱”存在于居民集中区中违法经营,“污”没有实现稳定达标排放等规范要求。这些违章违规经营无从查询,更难以到真实生产状况,几乎处于“监管真空”之下。

在海量场所中,搜寻并筛查出伪装、隐匿中的“散乱污”,就成为提高政府治理效率的关键一环。

以用电负荷数据为代表的高频基础数据,可以根据耗能的负荷特征、用电曲线等信息,勾勒出不同用户属性和初步的身份排查,相当于为每一个耗能用户自动生成一枚“健康码”。

以属地管理者为“散乱污”场所构建的判定条件为“诊断依据”,落入“散乱污”初步认定范围的异常用户将收到“红码”预警,工作人员即可锁定疑似目标,待实地核实、上报审批确认无误后,即可执行整顿措施并实现动态监控。

这是电力数据参与政务服务(to G)或者说城市治理的尝试之一。

而电力数据协助“散乱污”治理案例,也折射出中国地方政府治理思路的转变——从“大江大河式”的传统社会治理方式,进入到“毛细血管式”的数字治理模式。

这既依托数字化改造以实现高频数据采集,更有赖于多方交互、跨界协同。

剖析“散乱污”数据治理案例的思路与难点,可以观察到一系列大数据应用中待化解的共性问题,如数据采集标准化、跨界数据融合、算法公平、数据治理局限性等。

包括电力企业在内的实体企业,正站在完善机制以适配政府数字政府治理赛道的新起点。

政府治理切换至数据思维

从“大气十条”(2013-2017)到“蓝天保卫战”(2018-2020),两轮大气污染防控与环境治理周期在时间上无缝对接,所处的却是社会治理极速变化的不同阶段。在后一阶段中,从政府到实体企业开始渐次酝酿数字化改造与业务重构。

地方政府层面已有响应。2017年10月,广东省政府推动组建数字广东网络建设有限公司(由腾讯与联通、电信、移动共同出资),承接省级“数字政府”的平台运营。其他不少省份也成立了类似的省级“数字政府”运营主体。

2018年,《关于印发打赢蓝天保卫战三年行动计划的通知》发布,其中一项重点工作是,全面开展“散乱污”企业及集群综合整治行动,并要求全国在2020年底前基本完成。

可以说,“蓝天保卫战”是对“大气十条”的进阶和再深化。这一阶段,升级并加入数据思维,也体现在部分地区“散乱污”的具体治理工作中。

以广州市为例,2018年10月,广州市人民政府印发《广州市强化“散乱污”场所清理整治行动方案》(以下简称《“散乱污”整治行动方案》)。当时广州市政府层面决定将牵头部门在生态环保系统之外新增工信系统,意从基础数据、过程管控方面引入数字工具。

“传统(环保治理)的模式是,省里派人到市、市到县、县到镇街,镇街的基层工作人员既做裁判又做运动员。”相关人士表示,“数据一层层上报,每年数据都很漂亮,但环境治理结果一直不太理想,市民投诉情况也很多。”

据了解,“散乱污”场所通常无法取得合法的经营许可,多属手续不全的违章经营性质。政府无法凭借已有的信息登记情况,上述场所的真实生产状况。而在过去的治理式中,仅由基层工作人员现场排查,覆盖广度、效率不足的同时,存在瞒报、虚报且难以追责的困境。

使用高频基础数据协助治理的优势是:一可为量化分析提供基础,以定量指标筛选的方式提升治理效率;二能够做到数据系统监测的实时性,避免反复治理、仍不见效的出现;三数据所呈现的透明度具有监督性,能在一定程度打破基层治理中的信息不对称现象。

作为普遍服务属性领域,电力行业的数据由于在覆盖性、真实性以及智能采集的改造程度上具有优势,成为“散乱污”初始阶段数据建模构想中最重要的数据维度之一。

今年2月,工信部公布了2020年大数据产业发展试点示范项目,由广州供电局申报的特大城市“散乱污”大数据智能监管与治理(简称“散乱污”数据治理)项目位列其中。此项目从2018年10月起在广州投入试用,以电力数据为主、水务数据为辅进行建模。

广东电网下属穗能通公司是该项目的承接单位。作为系统开发团队负责人,穗能通公司创新孵化中心主任袁超表示,2018年底全广州报装的电力用户数量约为580万,数据建模筛选出的疑似场所有26万个场所。以1万多个基层排查人员来计算,平均每人只需排查26个场所即可。

目前,各产业各企业所采集数据的使用权仍普遍具有排他性。出于数据安全方面的考虑,广州供电局目前仅将电力数据使用权授权予穗能通公司。

经验+数据的双轮驱动

疫情期间,局部地区收集的个人身份、病史、地址信息在流转过程中存在泄露问题,视频会议软件Zoom也出现了严重安全漏洞,再度引发业内对于数据安全的重申和强烈担忧。

为规避数据泄露,目前很多企业采用的交付方式是“数据产品”,即仅为需求方提供分析结果,而不涉及原始数据。

“散乱污”治理案例中,电力部门数据分析团队在进行数据清洗、分析、挖掘后,给到政府主管部门的正是“数据产品”,也就是基于判定标准的“结果清单而非原始数据”。脱敏处理后的信息再流转,一定程度降低了数据泄露风险。

一般认为,政府或企业数字化转型的重要转变,是从“经验驱动”转变为“数据驱动”。但在算法设计、模型构建、规则设定中,依旧注入了人工经验(熟悉业务方)的判断和综合权衡。可以说,在现阶段的数字化转型中,“经验驱动”与“数据驱动”相互补充、互为支撑。

数据建模更核心的一环是“寻找特征点”,这背后依赖于人工经验的甄别和洞察力。

据了解,“散乱污”场所的特征是规模小、数量多、隐藏性强,分布规律是多集中在城中村和工业园区。对此,“散乱污”数据治理案例中,构建了两条典型的基于特征点的设定:

一是界定“散乱污”场所的月用电量阀值。

“一般普通居民用户每月用电量若超过600-800度已经偏高,若超过太多就属于典型的不正常的居民用电。”

据袁超介绍,2018年,根据典型的“散乱污”场所用电特性以及政府工作人员的经验,暂时将这个用电阀值定在3000度。2019年根据广州市各区域用户的用电特征,又制定了差异化的用电阀值,这对于找出伪装成居民身份违章经营的情况能起到排查作用。

在提供给主管部门的信息中,确认显示3000度以上用户清单即可,而无需提供具体的用电量数值。“这就保障了用户的数据安全和隐私。”袁超说。

二是根据用电负荷曲线特征来寻找。

在“量”之外,“曲线走势”是另一个判断维度。“散乱污”用户用电负荷特性,与普通居民用户的用电特征明显不同。居民家庭的用电曲线,有明显的峰谷平不同时段;“散乱污”属于生产型用电特征,全天负荷相对平稳。

在“散乱污”监测系统中,据袁超介绍,通过用电数据开展排查仅仅是大数据分析的一种手段,为进一步提升数据模型的度,数据筛选模式设定了关键词索引,通过对用户档案信息的扫描,将明显不是“散乱污”场所的用户从疑似清单中剔除。同时,结合过去的经验,在一些河涌流域、部分城中村制定了更加严格的标准进行筛选,减少漏网之鱼。

算法公平下的多方平衡

然而算法、规则不可避免的人为设定,又带来了另一个问题——算法公平。

去年7月,兰德公司一份名为《算法公平——社会应用框架》的报告就指出,数据驱动的算法,意味着算法对客观性的承诺,被更好地描述为对一致性的承诺。而这种一致性,并不意味着正确或没有偏见。

在广州“散乱污”治理中,设计的是3000度的月用电量阀值,但是随之而来的问题是,“2800度是不是就不行了?2900度有没有问题?”

本案例中,阀值设置的高低,涉及监管尺度松紧的把握,以及对合理性的规律总结和专业判断。电力部门作为项目执行方,在基于用电负荷特征给出意见时,需要结合主管部门对于执法度的衡量。

“构建数据模型的过程中,我们负责收集他们(各区主管部门)的业务需求,组织数据工程师和开发工程师实现相关功能。”袁超说,“根据需求,会对模型和细节提供技术支持,但我们不会去决定标准。”

袁超表示,在标准的界定上,“一开始构建模型的时候,就充分接纳了各镇街工作人员反馈的意见。”

在规则设定初期,更广泛的讨论、协调并敲定细则和共识,能在一定程度避免事后争议。

算法来自人工判断,理论上存在可操控的空间。如同于反垄断执法中的“价格合谋”问题,在数字监管领域也存在“算法合谋”的可能。

“镇街工作人员提出的筛选标准,也必须要经过政府主管部门的认可。”袁超也提到这一点。

算法难以做到百分之一百公平,但可以尽可能因地制宜,考虑差异化的客观现实。

阈值的设定,因区域经济发展水平和产业结构而异。以广州为例,属于城郊的增城、从化区总体负荷水平相对较低,为此相应下调了对“散乱污”的判定阀值。

跨地域的用电特征差异更为显著。“拿广州的标准到东莞、沈阳,模型可能就跑不动了,需要结合当地的产业结构建模。”袁超表示。

据介绍,在筛选出疑似“散乱污”场所清单后,名单将发送到基层工作人员的手机上,然后以“扫码抢单”的形式配置排查任务,已抢工单不会再次出现,避免重复排查。现场核查场所身份、生产设备等信息后,工作人员将通过小程序输入取证数据,经镇街、区、市逐级审批后,确定“散乱污”场所。

这相当于完成了一次自下而上的“毛细血管式”环境治理。这种模式下,对基层治理的监督和问责至关重要,数字化的可追溯性正好能起到作用。

“散乱污”在局部地区出现反复出现的原因之一,是部分基层人员在现场查处时徇私舞弊,而上级主管部门无从监督。本案例的应对方案是,基层人员在通过手机进行抢单时,实际上已经将核查责任与绑定。每个点是谁负责的,后台能够有迹可循。

另一点值得注意的是,基层人员从“扫码抢单”到根据“手机导航”准确定位到相应场所,需要对电力数据与地理位置数据进行匹配。这涉及到跨界数据的标准、规范如何衔接的问题。

“散乱污”治理案例中,本地电力部门在2017年推进的“地址结构化”工作,将电力用户数据与公安系统标准的门牌登记保持一致,由此可以实现依据用电数据定点导航的功能。

此外,数字技术和工具的更新频率快,如何让基层工作人员熟练掌握操作技能而不出纰漏,也是一个摆在眼前现实议题。

政府“串联功能”难替代

“散乱污”数据治理在设计之初,曾考虑同时引入电信数据、电力数据、水务数据等公用事业数据实行多维度监测。

《“散乱污”整治行动方案》提出的构想是,整合用电、用水和通信等数据信息,建设完成“散乱污”场所大数据监管系统,用大数据手段对各区、街镇、村、工业园区用水、用电等情况进行统计、分析和监测,对异常情况进行预警。

如此,将至少涉及三大行业的跨界协作,然而实践依旧未能完成跨领域、跨企业的“数据破壁”。

与组织相对松散、智能化采集滞后的水务系统相比,电信和电力部门的数据采集、归集和治理的底子更好,且均有专门的数据分析处理团队,能为快速投入政务应用提供基础。不过这又导致了新问题的出现——选择谁来统筹数据建模和分析?

现阶段,政府部门的需求是企业提供数据分析结果或者脱敏后的信息,并不会直接触碰具体数据;而大型基础设施提供方则难有动力将自身采集的数据,无偿共享给另一家规模庞大的公共事业公司。这不仅有数据安全、行业法规的约束,也有当下企业战略的考量。

鉴于“散乱污”筛查工作面向的是“场景型用户”,与电信部门提供的信令数据所体现的移动轨迹相比,用电负荷数据所反映的能耗情况,更能判断“固定场所”用户的真实生产、生活状况。该项目在起步阶段仅使用电力数据推进。

2018年底,用电负荷数据协助“散乱污”场所的监侦工作收效不俗。于是,本地政府在2019年进一步推动将水务数据纳入其中,并交由电力部门数据分析团队统筹双方数据建模。而后,广州供电局与当地的37家供水公司分别签订了数据保密协议。

尽管区域内供水企业体量较小,但同样存在跨界数据融合难题。政府的行政统筹力部分地应对了这一问题。“如果不是政府部门牵头,电力部门使用水务数据基本是很难实现的。”业内人士表示。

不过在该案例中,电信数据始终未能融合进来。

水务数据的使用权限问题解决了,可新问题是数据质量不高。以广州市为例,共有37家供水企业,既有国有企业又有民营供水公司,各家在管理模式、改造步伐上存有明显差异。

据了解,部分供水企业抄表周期为2-3个月,一些区域仍未完成“一户一表”改造,村镇一级甚至出现“一村共用一表”的情况。在管理标准不统一的情况下,水务数据的采集频率、精度不足,导致局部难以实现既定的筛查效果。

此外,有其他城市的工信、环保部门表示希望引进广州的“散乱污”数据治理模式,但各地相关数据供应企业未能达成就此共识,最后未能有实现模式的迁移。

在化解跨行业数据壁垒矛盾当中,行业主管部门单方面的想法并不能促成基于数据融合的“协作治理”,需要政府各相关部门的统筹。在推动搭建跨界数据平台上,政府所能起到的“串联”角色是不可替代的。

4月,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》发布,提到加快包括数据在内的要素价格市场化改革,充分体现技术、知识、管理、数据等要素的价值。

这还不够,相关实体行业的智能改造水平、数据标准化程度,是影响“美好构想能否现实落地”的前提条件和客观制约。这又需要政府及行业主管部门在数据采集的标准化和规范化方面,为满足数据跨界应用的有效衔接做出明确规定。

“大数据非雷神之锤”

当然,仅凭电力等基础数据定位协助搜寻和筛选,并不能做到滴水不漏。这不单单与数据维度的丰盈程度有关,还涉及大数据应用本身的局限性。

例如,大数据无法预测系统性风险,以及不可抗力因素的意外冲击;数据模型设定与认知深度有关,当认知出现盲区、掌握信息不足时,建模优化方式有限;此外,可能还会遇到数据失真、易操控性、算法合谋、无法体现因果关联等问题。

“大数据非雷神之锤。”袁超提醒,“不可能做到百分百,只是作为筛查的初步建议。”

据了解,在“散乱污”治理案例中,确实发现部分电力数据排查清单以外的“散乱污”场所。“存在偏差很正常,我们也开放渠道,将其他信息添加到系统中来。”袁超说。

正如健康码在服务于疫情筛查的过程中,由于各地标准差异而出现的“误判”现象,以及面对无症状感染者时的束手无策。

“健康码只能告诉你,他们做过一些初步的筛查。事实上本来就没办法去筛查无症状感染者。这不能说是健康码的一个漏洞,只能说是健康码存在筛查的一个盲区。”复旦大学附属华山医院感染科主任张文宏在接受公开采访时,对此提到过自己的意见。

张文宏补充说明,“健康码可以覆盖大部分病例的发现。漏掉少量无症状感染者,那怎么办?我们要另外设置一些机制。”在其看来,核酸监测是筛查无症状病毒携带者的技术手段之一。

“散乱污”治理也设计了大数据筛查之外的另一层“线下”监督机制,即通过微信上的环保信息采集功能,由基层人员对清单之外的“散乱污”场所进行现场录入,以实现不同渠道场所信息的集结。

无论是健康码还是“电力数据画像”,更多是为政府治理发起的一次“助攻”。在自上而下的政府治理框架基础上,补充上自下而上协同治理的新工具。

免责声明:本文来自自媒体,不代表大能源的观点和立场
精彩推荐