——江西局推进名录库动态维护更新机制改革综述
版次:01 来源:中国信息报 2025年05月08日
■ 本报通讯员 曹淳隽 邓新欣 冷 晴
经营主体的数量、规模和活跃程度,是衡量市场整体经济环境的重要指标。企业有活力,高质量发展才有动力。而建立大数据动态监测模型,正是江西统计部门倾力打造的一枚测量企业活跃度的“利器”。
构建企业活跃度监测模型
近年来,江西深入推进“放管服”改革、落实减税降费、强化金融支持,营商环境持续改善,经营主体数量显著增加。第五次全国经济普查结果显示,2023年末,江西共有第二产业和第三产业活动的法人单位76.1万家,比2018年末(2018年是第四次全国经济普查年份)增加67.4%;市场监管部门数据显示,江西实有企业数量已经突破一百万家。
经营主体规模的快速扩容,为市场经济注入新鲜血液的同时,也为统计基本单位名录库(以下简称名录库)日常维护带来了新的挑战。为有效解决实地调查核实工作量与基层维护力量不足的矛盾,今年以来,江西省统计局按照国家统计局普查中心的统一部署,积极推进名录库动态维护更新机制,构建企业活跃度模型成为此次改革的重点内容之一。经过半年多的数据准备、模型训练、参数调整和阈值确定,江西已初步完成本省的企业活跃度模型构建,模型准确率达到76.5%,高于全国平均水平,为名录库动态维护更新机制改革打下坚实基础,量身打造了企业动态监测的“温度计”。
工欲善其事,必先利其器。为高质量做好企业活跃度模型构建工作,江西局强化组织领导、精心统筹实施,认真学习《名录库动态维护更新机制应用业务方案》和《活跃度模型建立工作流程》,深入研究模型训练集整合规则、特征值筛选等关键内容。同时,推动名录库配套软件开发,在“赣数智”工程建立省级名录库节点,完善个性化维护功能;协助国家统计局普查中心制定《名录库数据同步业务需求描述》,推进国家和省级节点数据互联互通;配套建设部门数据蓄水池管理系统,实现部门数据云上储存、云上管理、云上查询。此外,扎实做好第五次全国经济普查数据与历史数据、部门数据的横向比对评估,为名录库新机制上线和活跃度模型测算打下坚实基础。
建立多部门数据共享机制
一个篱笆三个桩,一个好汉三个帮。企业活跃度模型的构建,其核心在于各类行政资料和统计资料的充分运用。部门行政资料越多元、越丰富,模型就越优化、越精准。
近年来,江西省统计局与多部门建立了长期稳定的数据共享机制,已实现市场监管部门数据每日传输,全省编制部门资料每月获取,提升民政、税务部门数据获取频率取得重要阶段性成果。企业活跃度动态监测模型启动以来,江西先后分30余批次导入部门行政记录资料累计达750余万条次,充实了模型构建的基础数据集。
2024年底,江西局根据建模方案,以2023年市场监管部门年报信息为训练集,以第五次全国经济普查结果为活跃标签,使用随机森林模型对数据集进行学习,结合江西省情反复调整和测试,经过40余次模型训练,最终确定最优模型参数,报国家统计局普查中心审定,获一次性通过。
提供精准、高效统计服务
企业活跃度模型,是判断企业经营状况的“利器”,但绝非实地调查核实的“平替”。统计机构还需参考模型测算结果,组织开展有重点、有针对性的实地调查核实。根据工作实际,江西对部分企业进行“核实提醒”标记,重点标注“准四上”企业、存续状态存疑企业、重要指标信息缺失或错误企业等。基层人员按照“核实提醒”标记开展实地调查核实,对“准四上”企业进行摸排和培育,对存续状态存疑企业进行经营情况确认,补充缺失的重要指标信息,核实修改错误的属性指标等。大数据模型虽然无法完全替代实地调查,但得益于模型的引入,基层开展实地调查核实的指向更明确,针对性更强、精准性更高,名录库维护更新工作达到事半功倍的效果。
当前,江西正着力拓展部门资料来源,探索获取人社、电力等更多部门的行政记录,力求通过维度更广、颗粒度更细的各类资料,持续强化模型构建的数据支撑。下一步,还将运用抽样调查等方式对模型的科学性和准确性开展实证检验,进一步调整阈值参数、优化迭代模型,持续校准企业活跃度“温度计”,为党委政府优化营商环境提供更加灵敏精准、靶向高效的统计服务。