——联合国大数据和数据科学全球平台区域中心会议观点综述(二)
版次:01 来源:中国信息报 2023年05月19日
■ 胡东 潘厉
区域中心将成为所在区域数据治理变革的领航者
巴西区域中心代表安德里亚·迪尼兹·达席尔瓦首先介绍了联合国官方统计使用大数据和数据科学专家委员会的组织架构,主要包括巴西、中国、卢旺达和阿联酋区域中心,以及地球观测、衡量农村可及性、船舶自动识别数据、扫描数据、移动电话数据、安全计算技术、私有数据共享、培训与能力建设、大数据与可持续发展目标等9个大数据任务组。她详细介绍了该中心成立以来开展的重点工作,如举办“网络抓取数据应用于CPI调查:工具和方法”“利用大数据、机器学习开展地物提取和土地利用测度”等研讨会,组织召开“拉丁美洲和加勒比地区官方统计大数据应用”年度磋商会议;协助移动电话任务组开展项目研究;协助培训与能力建设任务组开发官方统计大数据应用和培训的工具;参加2022年联合国黑客松比赛、国际数据科学加速器项目等。另外她还介绍了该中心的长期工作目标,包括加强区域官方统计合作、培训青年统计人员、推进大数据与数据科学研究等。
中国区域中心中方负责人、国家统计局浙江调查总队总队长张斌介绍了该中心最新进展。自2020年12月成立以来,在各方共同努力下,该中心开展一系列探索实践并取得良好成效。以多源多样的卫星遥感数据为依托,精准生成水稻等农作物空间分布数据,综合运用AI技术等实现粮食作物长势分季监测;完善利用商超扫描数据的方式方法及其数据清洗、配对和审核机制;利用主要电商平台交易数据实现分月网上零售额及其增速测算,以及分类商品交易趋势预测;探索对特定就业群体的识别和预测分析;开发部署数据应用研究服务平台、数据融合计算平台和中心门户网站;通过课题研究、项目合作等形式集聚起一批高素质的研究人才;积极参与国际重大统计活动协商,参与国际会议百余场次,连续举办三届大数据国际研讨班以及“地表信息自动提取精度提升”国际培训班等,组织推广联合国黑客松比赛,重点面向亚太地区开展培训和能力建设。他强调,面向未来该中心愿意承担更多国际大数据和数据科学的探索、研究和应用。一是整合高校、科研院所和头部企业等力量,组建开放式的数据实验室、项目组,联合开展多领域课题研究;二是与国际统计同行、国际组织、其他区域中心携手并进,推动更多项目合作;三是继续办好有关数据科学和官方统计现代化的高级别研讨会、培训班;四是聚焦农业统计、贫困和包容性发展测度等领域,分享大数据统计方法、知识和技术。
卢旺达区域中心代表特里斯·乌维马纳围绕成立背景、使命愿景、组织架构、项目进展和下一步工作计划等方面介绍了该中心的相关情况。她指出,作为卢旺达国家统计研究所成立的全新培训中心,该中心为数据获取和能力建设提供便利的环境,为整个非洲地区的数据科学、人工智能、机器学习和其他大数据相关技术等新数据分析领域的能力发展活动创造环境。目前,该中心已经在CPI调查领域组织开展了首个合作项目。下一阶段,该中心的工作计划包括开展首个合作项目的绩效评估,在特定领域(农业、环境等)开展更多合作项目,举办有关大数据和数据科学的线上研讨会,提供培训与能力建设服务,建立健全中心法律框架、运行机制和系统功能等。
阿联酋区域中心代表阿里·诺拉主要介绍了该中心在新数据源开发利用方面的研究进展和实践案例。一是扫描数据应用,自动收集价格数据用于编制阿联酋居民消费价格指数;二是塑料袋销售网点数据应用,量化评估阿联酋有关减少塑料制品使用的环境保护政策的执行效能;三是线上平台数据应用,获取有关旅游、观光、健康、教育支出和出入境等数据和信息用于官方统计;四是移动电话数据和消费数据应用,用于人口流动和假期消费行为监测。她还介绍了该中心2023年工作计划,包括与人工智能办公室合作开展青年大数据素养培训计划;与VISA、MF、META等跨国信用卡支付公司联合开展创新数据解决方案项目研究;与联合国大数据任务组开展线上或线下月度研讨会;与阿联酋政府合作开展机器学习、传统工艺数字化转型等项目。
数据科学快速发展对政府统计的机遇和挑战
联合国亚洲及太平洋经济社会委员会统计司司长瑞秋·比文认为,对于政府统计来说,大数据既带来了重大发展机遇也带来严峻挑战。当前社会各界对数据的质量、细化和公开程度及需求层次都不断提高,高质量、及时、开放和包容性的数据对于制定政策和促进决策至关重要。这些都对各国政府统计机构提出新的要求和挑战,不仅要用好传统的统计方式方法,更要用大数据补充传统统计短板,改进数据生产方式,提升统计调查质量和效能。并利用数据科学改进数据处理、分析和共享机制,进一步提高开发利用数据的能力,如在国民经济核算中利用船舶自动识别数据衡量经济热度。她希望联合国大数据全球平台各区域中心在新数据源开发、挖掘及方法分享方面发挥引领作用,帮助所在区域的国家更好掌握有关大数据和数据科学的新技术新方法。比如在重要课题和项目的研究中引入不同的利益攸关方,或者建立开放的、可接入的平台,让更多的区域内国家更好参与进来。
中国浙江财经大学教授李金昌介绍了数据科学的四大技术领域,即人工智能、区块链、云计算、大数据。他认为数据科学的发展与应用将深刻影响人类的生产方式、就业方式、分配方式、生活方式、社交方式、思维方式、消费方式和科研方式。同时数据本身作为一种生产要素,将极大地改变政府统计的基础,包括产生渠道、构成类型、储存方式和采集方式。他认为,政府统计要主动适应上述变化,运用数据科学技术重构政府统计系统,积极拥抱“智能化”。如智能化大数据储存系统,智能化信息采集系统,基于宏观、中观、微观数据的智能化综合分析评估预警系统,智能化专题分析系统,智能化数据审核系统等。
联合国统计司副司长罗纳德·詹森在最后总结发言中指出,本次会议有助于团结包括国际电信联盟、国际货币基金组织在内的国际机构,以及巴西、中国、卢旺达和阿联酋区域中心,在联合国大数据全球平台框架下进行合作,共同应对新形势下全球统计和数据生产面临的新机遇、新挑战,为落实全球发展倡议和联合国2030年可持续发展议程共同努力。
联合国黑客松比赛旨在推动全球可持续发展
联合国黑客松比赛召集全球数据科学人才,通过编程、建模、数据分析等形式,推动解决全球性危机,为实现2030年可持续发展目标提供创新解决方案。会上,2022年联合国黑客松比赛青年组、专家组冠军团队和最佳展示奖团队分别介绍了他们的参赛项目。
青年组冠军黎巴嫩“数据眼”团队的参赛项目致力于推动可持续发展目标2——零饥饿。一直以来联合国粮食计划署向黎巴嫩等地区贫困人群发放食品包,但近年遇到了食品价格飙升、贫困人群规模增长、食品供应不稳定等诸多挑战。该团队利用大数据技术优化了食品包采购和发放机制:一是从超市网站抓取相关食品价格信息,在不降低质量的前提下实现食品包最优性价比;二是结合卫星遥感影像和机器学习技术精准定位需要帮助的贫困人群。该团队代表指出,接下来将与联合国相关机构开展更深入的合作,助力“零饥饿”目标的实现。
专家组冠军印尼Cerdasdata团队展示了其参赛项目全球运输网络自助服务分析平台。该平台主要依托于船舶自动识别数据,主要提供两大功能:一是决策支持系统,利用知识图谱技术监控全球航运网络,实时处理船舶自动识别数据;二是对世界经济统计指标进行分析并寻求替代指标。并以波罗的海、黑海作为试验海域,利用该平台分析了俄乌冲突对上述海域航运和贸易的影响。
最佳展示奖国际货币基金组织团队展示了大数据在鲸鱼保护领域的应用。鲸鱼对海洋生态系统的稳定性和碳循环有着关键性作用,保护鲸鱼有助于应对全球气候变化挑战。该团队代表指出,国际货币基金组织通过监控全球鲸鱼市场资金流向数据,以打击非法捕捞和贸易现象。他强调,国际货币基金组织将深化大数据应用,在鲸鱼保护领域不断推动全球合作。