IT经理世界 治理数据

来源:百度文库 编辑:神马文学网 时间:2024/05/23 11:26:11
 周慧洁

        国内80%以上的大中企业已经实现财务电算化,但企业数据的有效利用率却不足7%。

        美国好莱坞的警匪片中经常出现这样的镜头:警察往电脑中输入嫌犯的社会保险号(Social Security Number,SSN),就能立即调取出此人的相关信息,身高、血型、驾照号这些基本资料一应俱全,就连他最近的信用卡记录和纳税记录等也能立即被调取出来。

        从浩瀚的数据库和错综复杂的信息系统中如此迅速地找出这些数据似乎对于拥有世界上最先进信息手段的美国政府来说,并不是什么难事。但细想下来,各种数据来自不同的系统、不同的地区,甚至同一数据的源头也可能不同,存在海量的干扰数据,如何分析、筛选、合并数据,并在很短的时间内找到所需的准确数据并非人们看到的那么容易,这背后需要强大的数据管理系统提供支持。

        除了美国政府,还有很多美国企业也正在领会到数据管理的重要意义。一些美国企业的信息化历程已经超过五六十年,各种信息系统更迭换代、技术覆盖面很广、数据庞杂且来源复杂,积累到一定量后不仅对信息系统运行的贡献力不大,甚至可能对其造成干扰。所以,许多企业开始针对数据进行治理,分析、合并各种历史数据,再从质量上佳的数据中寻求最有价值的数据,以供企业分析、决策使用。

        相对于美国企业,中国大部分企业的信息化历程不过10多年,信息系统采集、沉淀的数据看似还不至于对企业造成困扰。但事实并非如此,中国企业信息化时间虽然不长,但历程却同样复杂,尤其近几年,国内企业的信息化程度逐步加深,企业并行上线了ERP、CRM、SCM等管理信息系统。伴随而来的是“信息化的手段越高,积累的速度越快,数据膨胀的速度也越快”,数据质量问题日益困扰着中国企业。

        根据国家财政部的统计,国内80%以上的大中企业已经实现财务电算化,但企业数据的有效利用率却不足7%。这使得企业在信息化建设方面的巨大投入只能获得部分回报,IT资源浪费巨大。

        质量决定数据

        最近,北京天坛医院的信息中心主任王韬正在考虑建立一个“医疗鉴别诊断知识库”,供临床经验还不是很丰富的新医生诊断病人病情时参考使用。之所以有这样的计划是因为天坛医院此前在国内医疗行业率先使用了PACS系统(医学影像存档和通信系统),以取代传统的胶片把病人的病历影像资料用数字化图像的形式保存下来。“短短几年,我们医院积累的影像数据量已经超过6个T。”王韬说。

        这些影像数据资料除了供当时接受诊断的病人使用外,对其他医生诊断别的病人也是很珍贵的参考资料。于是,王韬想通过建立“知识库”,从这些海量数据中筛选出有价值的影像数据资料,以实现医生知识共享。此外,他还打算建立天坛医院的辅助决策系统,让医生能方便地访问筛选出的有效数据,从中自动选取对他们有价值的资料,帮助医生诊断病人病情、制订治疗方案。王韬的这个设想与新兴的数据治理的提法不谋而合。

        “数据治理的意义就是发挥出数据的最大价值。”Informatica公司大中华区总经理田哲夫说。10多年的信息化建设已经让中国企业发现,数据是企业管理的“命脉”。如何让积存已久的数据“重见天日”,将数据的价值真正发挥出来成为数据治理的重点。

        企业运行需要依赖各种信息系统,不同系统具有不同的数据结构;此外,同一企业跨地区、跨领域获取的数据也需要归类,这些都涉及到对数据的提炼和管理。

        此外,信息产业层出不穷的新技术一方面在产生大量数据,另一方面对数据质量有着更高的要求。时下很热门的RFID技术可以对养殖场里的任何一只鸡的生长过程进行跟踪,记录每只鸡从出生到运走的每天饮食和活动数据。这些数据可以为防范禽类疫病传播提供参考依据。这些必然要求企业建立一个强大的数据平台对各种信息系统采集的海量数据进行提炼、归纳和选取,才能在最短的时间配合相应的信息系统分析处理数据,让企业的IT投入快速、高效地产出。

        去伪存真

        数据治理的根本途径就是要对数据进行分析和保护。在田哲夫看来,数据治理包括数据的移植、合并、质量管理及同步使用等。

        对于数据移植,CIO们并不陌生。当信息系统扩容、更新换代或应用发生转变都会涉及数据移植。在这个过程中,CIO只要充分考虑数据移植前后,数据的完整性、一致性、可靠性,难度并不大。

        田哲夫:数据治理的意义就是发挥出数据的最大价值(右图)

        在数据治理过程中,CIO经常会碰到数据合并的问题。最近,澳大利亚标准协会准备变更一个标准——马桶的承重量标准。这是因为随着现代人饮食结构和体质的改变,人们的平均体重增加,旧的马桶负荷标准已越来越不适用现代人的需求。可是新标准如何确立,就要依靠统计数据决定。然而统计数据来源复杂,可能来自于不同地域、不同系统,这就涉及到对不同源头的各种格式的数据进行纵向合并。

        另外,在企业内部数据库中也存在大量的数据,尽管它们是以不同属性、不同结构散落在不同的系统中,多数也是准确的,但也有一部分数据是相互矛盾或不准确的,使用这样的数据肯定会造成误差。因此,对数据的质量管理就变得十分重要。对此,田哲夫建议企业可以通过统一的平台对数据源进行管理,建立一个指标体系,对数据的采集路径进行跟踪,以确保数据的正确性和有效性。“数据可以自下而上、由点到面汇总上来。当发现与事实不符时,也可以由上而下找出问题,进行追踪。”

        不同信息系统中的数据保持同步对于处在激烈竞争环境中、对变化要求快速响应的企业十分重要。博士伦公司在中国有300多个销售网点,这些网点的销售员每天都要用PDA将销售数据和竞争对手的信息记录下来,并通过公司的移动访销系统将数据上传至总部。对于远在北京的博士伦中国总部来说,这些数据非常重要,它们是企业BI系统分析的基础和关键。“这些数据通常每小时更新一次,公司决策层可以在任何时候都能掌握最新的销售数据,这对公司很重要。”博士伦中国区信息管理和技术高级经理陈其伟说。

        如今,越来越多的组织开始意识到数据质量的重要性,尤其是电信、金融行业对数据质量的要求十分严格,因此有效治理数据对于它们的意义不仅是合理利用IT资源,而是直接反应在经济效益上,所以数据治理已成为这些企业搭建信息系统的重点。

        其实,无论是数据的移植、合并、质量管理及同步,从技术角度来看,处理起来并不复杂,既可以通过建立统一的平台集中来进行数据治理,也可以针对其重要性分段处理。如今,一些企业已经意识到数据质量对企业的重要意义,有些企业也会对其进行定期维护和管理,但就目前而言,通过手工进行数据治理的国内企业居多。随着企业规模扩大、市场竞争加剧、人力资源成本越来越昂贵,单纯依靠人工提升数据质量势必会影响企业IT投入回报,进而甚至可能影响企业的发展。因此从长远看,通过统一的数据管理平台对数据进行规范化处理无疑是更为高效、快捷的办法。

        对于那些还未建立信息系统或信息化尚不完善的企业,数据治理理念同样可以帮助这些企业的CIO规划如何搭建、重组系统,争取将未来系统中积累的数据价值挖掘到最大。“在系统设计时,就开始思索如何标准化、规范化你的数据,你将会获得更有价值的数据。”田哲夫建议道,“那样,你在选择应用系统或开发环境的同时,就能避免浪费投资和资源。”