数据即服务(Data as a Service; DaaS)
目录 |
数据即服务是指与数据相关的任何服务都能够发生在一个集中化的位置,如聚合、数据质量管理、数据清洗等,然后再将数据提供给不同的系统和用户,而无需再考虑这些数据来自于哪些数据源。
DaaS是SaaS的孪生兄弟 ,作为“as a service”家族成员之一,它将数据作为一种商品提供给任何有需求的组织或个人 。SOA(service oriented architecture,面向服务的体系架构)是一种业务驱动的、粗粒度、松耦合的服务架构,支持对业务进行整合,使其成为一种相互联系、可重用的业务任务或服务,是实现DaaS最有效的方法。基于SOA的DaaS体系架构如图1所示。基础异构数据资源经过数据整合后生成符合公共语言模式的视图,最后利用Web service技术将视图封装成具有公共接口的服务供用户调用,从而实现数据资源的按需获取。[1]
DaaS解决方案能够提供以下的优势:
敏捷性。通过数据访问的整合,客户能够更加快速地对其进行移动,而无需再去考虑底层数据的来源。如果客户需要稍微不同的数据结构或者调用特定位置的数据,DaaS通过最小程度的变更能够非常快速满足需求。
成本效益。服务提供者找数据专家来建好底层架构,表现层可以外包给别人(报表和仪表盘用户界面等),同时使得任何变更需求都能更灵活的满足。
数据质量。通过服务来控制数据的访问,这对数据质量改进非常有帮助,因为更新点只有一个。当服务彻底测试之后,如果下一次部署不发生变化,那么他们只需要进行回归测试就好了。
效率、高可用和弹性。这些优势来自于虚拟化,物理服务器资源共享将提升效率,跨多个物理服务器的集群可以提高可用性,动态调整和实时迁移集群节点到不同的物理服务器能够增强弹性。
客户需求构建一个DaaS平台,其中所涉及的元素主要包括:
数据采集(Data acquisition):来自于任何数据源,如数据仓库、电子邮件、门户、第三方数据源等。
数据治理与标准化:手动或者自动整理数据标准。
数据聚合:这个有很强的服务与技术驱动的质量控制机制,不是简单地写100个ETL程序。
数据服务:通过web服务、抽取和报表等,让终端用户能够更容易地消费数据。
随着云计算的发展,现在已经出现了许多云平台以及分布式系统。云计算的模式是业务模式,本质是数据处理技术。数据逐渐成为了一种宝贵的资产,正如一句话所说:谁拥有了大数据,谁就拥有了未来。云为数据资产提供存储、访问和计算。盘活资产,使其为国家治理、企业决策、个人生活服务,就是一种数据即服务的思想。
现在数据的来源各种各样,比如互联网企业:SNS、微博、视频网站、电子商务网站;物联网、移动设备、终端中的商品、个人位置、传感器采集的数据;联通、移动、电信等通信和互联网运营商;天文望远镜拍摄的图像、视频数据、气象学里的卫星云图数据等。
这些数据的拥有者,就可以通过大数据相关技术,如分析技术、存储技术、计算技术等发掘数据中的价值,然后提供服务。
乔布斯时代的苹果公司开创了一种全新的模式:Appstore + iphone/ipad,这种模式改变了人们的生活方式。所以,我认为数据即服务,应该也会像Saas、Paas、Iaas一样具有一种运营模式,进而改变人们的生活。
随着云平台的出现将来一定会出现另一种模式:云平台+大数据=数据服务。在云平台上存储着大量的数据,即一种宝贵的资产,经过挖掘会产生有价值的发现,再进行定制开发,便可以提供针对用户的数据服务。为国家治理、企业决策、个人生活提供服务。
如果数据在安全的基础上达到有效的共享便会产生更大的价值。例如把一个国家的各产业的数据共享互通,然后进行知识发现,为产业结构调整提供决策支持。
数据即服务的概念源自于交易、产品以及客户数据能够按需提供给用户,而不必去考虑地理位置或者不同的组织部门。此外,PaaS(平台即服务)和SOA的出现使得数据所处的实际平台也变得无关紧要。
数据即服务拥有非常多的用例:提供单一版本的事实(Single version of truth)支持实时商务智能(BI)交易处理的高性能扩展大数据分析跨多个领域的联合视图增强安全性与可访问性云数据、合作伙伴数据以及社交媒体数据的整合移动应用信息的交付企业范围内的搜索相关领域知识,应用知识,人员与技能,流程和技术平台是DaaS策略的关键需求。DaaS的精髓在于使数据管理更为集中化,让更多的用户无需去注意底层数据的问题,而将注意力完全放在如何使用这些数据。