千人计划网站
  设为首页 | 加入收藏 QQ群: 微信公共账号
注册 | 登录 | 中文|English
千人计划网广州  浙江  广西 欢迎广大海内外高层次人才踊跃申报千人计划、国内各地人才计划
您所在的位置:

度阡越陌 数据通衢

“燕云DaaS”平台解决世界性共享难题,已在全国30多个省区市应用
来源:人民日报 作者:余建斌 2017-07-17 10:49:10
  “我们经过两年的探索与尝试,传统的数据搬家、数据重写,或者是把数据格式统一起来,发现这几条路都走不通。”贵阳市政府一位负责人的这段话,说的是贵阳建设政务数据共享平台的经历:由于每个部门的业务类型不同,采用的数据格式和标准也不一样,加上数据量十分庞大,50多个政府部门的数据一直无法打通、共享。

  在偶然听到北京大学梅宏院士的学术讲演后,一套叫做“燕云DaaS”(下称“燕云”)的软件平台被贵阳市“请”了过来。“燕云”没有辜负期望,仅1个月,5名实施工程师,在没有原来的信息系统开发商配合、不需要数据库开放等前提下,完成了贵阳全市53家单位315个系统2290个功能项的梳理,形成1016个数据目录,给出了一份“又全又鲜活”的数据资源台账,初步实现了政务数据的有序流动和按需共享,极大提高了共享和开放的效率。

  构建连接不同系统的管道,让深藏在封闭系统中的核心数据安全流动

  “为什么我们能够实现这种方式,这就是‘燕云’的独特技术——‘索引管道式’数据共享交换方式。”燕云技术转化基地、北京因特睿软件有限公司首席执行官张颖博士解释说。

  和传统手段最基本的区别是,“燕云”可以在不打破原有数据的基础上,构建连接各种系统的数据共享流通管道,让深藏在各自独立而封闭系统中的核心数据“安全流动”,保障数据“鲜活、按需、有效、安全”。

  梅宏院士打了个比方,如同挖隧道用盾构机来替换传统开路挖地一样,“燕云”这项技术就像盾构机,在获得用户授权后,就可以构造出连通不同系统的数据管道。如同水在水管、燃气在燃气管流动一样,各个系统的数据就在这些对应的数据管道中有序流动,实现了按需交换共享。数据的提供方可通过管道的总闸来控制数据流出的内容,数据的使用方可以拧开管道的终端龙头来使用鲜活的数据,管道的运营方负责维护好管道的正常运行,责、权、利很明晰。

  在国家两期973计划(国家重点基础研究发展计划)的支持下,北大联合国内一批著名高校和科研机构一直在探索“网构软件”。“我们把互联网看成是一台计算机,研究动态、多变、异构的网络环境下,软件系统的形态、架构、机理。”梅宏院士说,“燕云”就是网构软件的研究在打破信息孤岛、实现系统互联互通上的延伸。

  在能力、效果、质量、效率和成本等方面,“燕云”比起谷歌、苹果、微软、IBM等行业巨头的自有方案毫不逊色。

  一年多来累计打破2000多个信息孤岛,将数据开放和流通效率提高数十倍

  业内专家认为,目前人们都认识到了大数据的价值所在,挖掘和利用大数据却不是简单的事。拿政府部门拥有的数据来说,由于长期以来政府各部门根据自身职能自行主导建立各类职能信息系统,缺乏统一规划和数据核准,致使政务数据源分散、数据相对割裂、数据格式各异、应用及服务碎片化,无法准确掌握全局数据资产状况。而用传统的数据分析、匹配及整合方式,则协调难度大、成本高、耗时耗力、难以推进。

  “我们不去改变数据库,不去重新改变数据格式,也不需要把数据全部搬到一个中心去,只是通过一个接口就实现了数据的共享。”贵阳市政府的这位负责人说,到今年5月,在“燕云”的帮助下,贵阳市14个领域、49万条的政府数据已面向社会开放,既发挥了“让百姓少跑腿甚至不跑腿”的效用,也对打破政务大数据壁垒进行了有效探索。

  北京大学软件研究所副所长黄罡教授介绍,作为一套支撑数据共享开放、互操作和信息孤岛系统集成的软件平台,“燕云”推出一年多来,已在全国30多个省区市应用,覆盖公安、司法、教育、农业、通信、能源、电力、交通等多个行业,累计打破2000多个信息孤岛,将数据开放和流通效率提高数十倍,人力成本则降低数十倍。

  5月,“燕云”获得工业和信息化部评出的“十佳大数据案例奖”,被评价为“探索了大数据运营服务的新模式,为建设国家统一数据共享交换平台提供了有力的技术支撑”,同时获奖的是京东、中兴通讯、蚂蚁金服等行业领先企业。

  国内唯一、国外同类产品还在萌芽之中,“燕云”这项被誉为“首创成果”的尖端技术,从北京大学几位院士和软件研究所团队十多年的研究成果转化而来,可以说一出生就跑在了业界前列。

  数据孤岛现象广泛存在,变为信息通衢是大数据应用变现的基础和关键

  “解决数据孤岛问题,需要法律法规、标准规范、技术手段三管齐下。”梅宏院士说。

  目前,我国已首次在国家层面提出了“公共数据资源开放”的概念,将政府数据开放列为了中国大数据发展的十大关键工程,多地出台了与大数据发展相关的政策,上海、北京、贵州等10余个省市建设了专门的政府数据开放网站和平台。

  数据的开放共享是大数据产生价值的必要条件。让“信息孤岛”变为“信息通衢”,是大数据应用变现的基础和关键。

  专家表示,大数据中的浅层数据来自于以天文数字计的互联网网站,即使这么大量的浅层数据也只占到大数据储量的4%。而大数据中占储量96%的数据则是来源于政府和企业内部的应用系统的深层数据。这些信息系统所蕴含的数据量非常巨大,但是它们存储在相应的系统里面,不遵循标准协议,想要把这些数据用通用的方式挖掘出来非常困难,这些数据就形成了数据孤岛。

  广泛存在的数据孤岛现象,严重制约了大数据技术与产业的发展。北大软件研究所曾经进行过调研,考虑到我国至少有10万个在用的政府信息系统,如果按照全新的数据共享开放标准替换这些系统,大约需要1000万人天和1000亿元,时间和成本的开销巨大。

  “目前大数据领域已经形成一个共识,在我国当下所存储的数据中,政府部门以及履行公共服务职能的机构与企业所占据的1/3数据,是所有信息当中质量最高的。这部分数据的开放,不仅能够有效提升社会运行效率,还能激发巨大的商业价值。”黄罡说,政府要发挥作用,特别是要打破一个个互不相连的“信息孤岛”和“数据烟囱”,“燕云”探索的正是用独特的思路来破解难题。

  中国互联网协会理事长邬贺铨院士表示:“未来,数据的价值在于融合和挖掘,但面临的挑战还不少,如数据资源的开放共享程度低,技术创新与支撑能力不强,大数据应用程度不高,大数据产业支撑体系不完善等问题,需要各界共同努力。”
声明:凡本网注明“来源:XXX”的文/图等稿件,本网转载出于传递更多信息及方便产业探讨之目的,并不意味着本站、中组部海外高层次人才引进工作专项办公室赞同其观点或证实其内容的真实性,文章内容仅供参考。
重点推荐
千人计划
科技部部长万钢25日在吉林长春发表演讲时表示,氢具有来源广泛、大规模稳定储存、持续...   详细>>
独家策划
千人计划
千人计划网在中组部海外高层次人才引进工作专项办公室的指导下已运作四年,在这四年中...  详细>>