基于知识图谱的数据开放研究综述文献综述
2020-06-04 20:26:39
一、选题背景
近年来,信息技术和互联网的迅猛发展,带来了各个行业领域数据量的爆发式增长,数据正在成为驱动经济增长和社会进步的重要基础和战略资源。数据开放是指将数据公开地被任何人免费地获取访问、再利用、再分发的理念,目前已经得到广泛认可[1]。实行数据开放,不仅能够极大提升公共服务的有效性和针对性,还能快速带动移动互联网、大数据及数据服务产业的发展。
二、研究现状
本课题围绕数据开放问题,广泛搜集了国内外相关文献资料,掌握了数据开放的研究发展现状和热点问题,现从国外、国内两个方面进行综述。
(一)国外数据开放研究发展现状
国外关于数据开放问题的研究最早可以追溯到21世纪初,主要以美、英、法等发达国家为主,主要集中在战略政策、开放形式、开放内容等方面[2]。
1.战略政策方面。全球数据开放运动最早始于美国。2009年,美国总统奥巴马签署了《开放透明政府备忘录》,首次将数据开放工作提到重要日程[2]。同年,美国联邦政府发布《开放政府指令》,运行世界上首家数据门户网站data.gov。2011年9月,美、英、南非、巴西等八国联合签署《开放数据声明》,宣布成立开放政府合作伙伴[3]。2012年6月,英国内阁办公室发布《开放数据白皮书》,进一步加速数据开放进程。2013年6月,美、法、英等八国集团首脑签署《开放数据宪章》,宣布制定开放数据行动方案,并按要求向公众开放可机读的政府数据。
2.开放形式方面。2013年12月,美国政府指出,将提供便利渠道使公众能高效获取有用的政府数据,会按照战略资产来管理数据、改进网站,并全面开放农业、营养、自然灾害等方面的相关数据[4]。同年,英国政府在数据开放计划中指出,将通过与社会、机构、公众沟通来明确优先公布数据类型,把所有数据集通过国家数据门户网站data.gov.uk发布,并为政府数据建立专门的国家级信息基础设施[5]。此外,各国数据开放的策略主要是将可机读的数据集、应用程序等资源,公布于政府数据门户网站,数据开放格式主要是CSV、HTML、XLS、NII、PDF、ZIP和XML等[6]。
3.开放内容方面。从国外开放的数据来看,民生需求类数据比重最高。美国的开放数据包括农业、消费、教育、能源等二十大类,加拿大开放数据主要为公民身份与移民申请等,新加坡开放数据主要为移动用户数、通信服务等,印度开放的数据主要为电子技术、热成像产品、国内储蓄等[7]。
从上述内容可以看出,国外数据开放的研究发展具有鲜明的五大特点,即出台战略和政策、示范和典型案例、开放数据门户、数据安全及隐私保护和数据再利用。虽然国外在数据开放领域取得了许多实质性的进展和成绩,但依然存在着突出问题,主要表现在缺乏元数据、数据质量与开放水平参差不齐、数据群未能覆盖全部数据、数据保管薄弱、缺乏对初级用户的支持、缺乏数据反馈与改进机制、缺乏数据质量评估工具等。