2007年6月第10卷第6期 中国管理信息化ChinaManagementIorfnmationizationJun.,2()7XVol.10,No.6企业商业智能系统的架构及实施研究王兆红(潍坊学院计算机与通信工程学院,山东潍坊261061)〔摘要」商业智能系统可以从来自企业不同的业务处理系统的数据中,提取出有用的数据,整合到一个企业级的数据仓库中,并对数据进行分析和处理,为管理者的决策过程提供支持。【关键词」商业智能;数据仓库;元数据;数据挖掘[中图分类号]F27o.7;C931.6[文献标识码]A[文章编号]1673一0194(2007)06一0015一032商业智能的体系结构商业智能是由数据仓库、 查询报表、数据分析、数据挖商业智能的整个系统被划分为4个层面, 根据数据的掘、数据备份和恢复等部分组成的、以帮助企业决策为目处理和应用过程分成7个环节。从数据源经过抽取(Exta,r的的技术及其应用。商业智能是数据库技术、OLAP技术、E)、转换(Transorfm,)、T装载(助ad,)过程加载到数L数据采集和迁移技术、网络技术、GUI技术、查询报表技据仓库,再从数据仓库经过分类加工放到数据集市(Data术、统计学、人工智能、知识发现技术等理论和技术的综合Makrte,DM),或者将数据集市中的数据进一步存放到MultiimensionDatbaase,MDD),这都属于数据运用,其核心内容是从许多来自企业不同的业务处理系统数据库(从中间层到终端用户或从数据库到终端的数据中,提取出有用的数据,进行清理以保证数据的正组织的问题,确性,然后经过抽取(Extctarin)、o转换(Transofmariotn)和用户可将其划归为前端应用实现的问题。而贯穿整个体系装载(肠ad),即E几过程,整合到一个企业级的数据仓库数据处理环节的,是系统的流程调度控制和元数据管理,里,从而得到企业信息的一个全局视图,利用合适的查询其结构如图1所示。1商业智能的概念和分析工具、数据挖掘工具等对数据仓库里的数据进行分下面对商业智能的完整的体系结构作如下解释: 析和处理,形成信息,把信息提炼出辅助决策的知识,最后把知识呈现给管理者,为管理者的决策过程提供支持。[收稿日期]2()卜11X一16 ()1数据源。数据源可以是企业日常运作积累下来的各类的业务数据,也可以是外部的数据。数据仓库的体系结构必须能处理这种多样性带来的种种问题,并解决由于数据远程迁移所带来的完整性和安全性的问题。了企业进行战略匹配分析的过程和步骤。这些对于展开后 首先分析企业内外部经营环境和IT环境,对组织的发展战略进行审视和思考;再根据规划小组的rr思维,判断组织战略与未来信息系统之间是属于何种关系,是支持期具体的信息系统规划是非常必要的,可以明确企业信息系统建设所要达到的目标、遵循的原则以及所要覆盖的范围。此外,企业也必须意识到其外部环境、竞争战略、内部运营的,还是支持产品和服务创新的;然后,结合组织现状分析和组织现有资源与能力分析构建出有了信息系统之资源都是在不断变化的,反映出企业能力也在不断地变后的新组织模式;有了新的模式后,对比企业原有的模式,化,因此在这个过程中要对市场作出迅速反应,形成动态从而使企业在动态竞争环境中获取可持续发就产生了组织对信息系统的需求;有了需求之后,再分析的制定过程,一下企业的资源能力,能做什么,不能做什么,就正式形成展的核心竟争能力。了信息系统所要解决的关键问题;接下来就是在此基础之主要参考文献上形成组织的信息系略。在这一过程中, 最为困难的是从企业的战略对应分析映射到企业信息系统关键功能。传统的ISP为这一过程提供了大量方法。比较著名的有:企业系统规划法(Busiesn[1」Hende,JC,VekatnarlnanN.Strategic川1,ment:玩veraglngln-of martionTechnOlo盯forTrnsaorfu嗯orngallization[J〕.IBMSys-t emsjournal,Vol32,No.1,1993ySstemsplanning,BSp)、战略集合转移法(Sttear盯Setrrransofmartion,SST)、关键成功因素法(CriticalsuccessFactosr,CSF)、价值链分析法(Value一hainAnlaysis,VCA)等等,每种方法都有其自身的特点和适用范围。六、结语 本文主要是结合He ndersn提出的战略匹配模型o(SAM),分析了在不同的外部竞争环境和内部环境中企业如何选择不同的信息系统与企业战略匹配的途径,并给出【]俞东慧,2黄丽华,石光华.建立与企业战略相适应的仃战略的路径和方法研究—对U邢和Fe dEx的战略匹配案例研究[].管J理工程学报,2( )5,X1(1):924.【]杨青,黄丽华.企业规划与信息系统规划战略一致性实证研究3「 ].管理科学学报,20J03,(46):3.4〔4〕杨青,王延清,薛华成.企业战略与信息系略规划集成过程研究【 ]J.管理科学学报,2创X),3():41.6〔5」张玉林,陈剑.企业信息化战略规划的一种新的分析框架模型〔 J」.管理科学学报,205,(48):9.8C于刀NA八4鸿N鸿GE州王NTI到下OR州rATION佗片刀ON/15企业管理信息化前端应用数据挖掘信息门户郊识及现。、,.,,一{议二,!篇二!二,.二,r未,,.:}决策树预测模型关联规则1口C只毛p」1聚类夕尺夕硬1皿1更火侧毛民必星!,屯月天恐光男UI于纽1 信息; 去。叨, 刊(厂},,一1一一-!分析报表EIS!分析}报表ES}信息查询}……信息查询.1‘.J数据存储数据集市厅云和}二数据分析口数据仓库广一落痴厂一门卜协才数据分析数据清洗、转换、装载理管程度流调数据集中泌朴理数据源弋荞黯薪舜外部数据业务数据2图1商业智能体系结构 ()2数据抽取、转换和装载(ETL)。从源数据抽取数据、④数据管理: 数据仓库操作过程以及数据仓库操作结进行一定的变换、装载到数据仓库。需要进行数据处理,包果的模型,包括描述数据抽取和清洗规则,数据加载控制,括:简单变换:一次只针对一个字段,而不是考虑相关字段临时表结构、用途和使用情况,数据汇总控制。的值;清洁和刷洗:为了保证前后一致地格式化和使用某( )前端应用:7数据仓库的前端应用是建立数据仓库一字段或相关的字段群,检查字段和字段组中的实际内容的目的,即根据用户的特点提供不同的界面。最终用户对而不仅是存储格式;集成:要把从全然不同来源的数据结数据仓库的访问方式包括:即席查询、报表、联机分析处理合在一起,真正的困难在于将其集成为一个紧密结合的数(OLAP)、数据挖掘以及领导信息系统(EI)等。S据模型;聚集和概括:按照一个和几个业务维将相近的数( 8)数据挖掘(DataMining,DM):数据挖掘是采用数值加在一起,聚集是将不同业务元素加在一起成为一个公学的、统计的、人工智能和神经网络等领域的科学方法,从共总数,在数据仓库中它们是以相同的方式进行的。大量数据中挖掘出隐含的、先前未知的、对决策有潜在价( )数据仓库。数据仓库的一个目的就是把企业的信值的关系、3模式和趋势并用这些知识和规则建立用于决策息访问基础从一种非结构化的或发展中的环境改变成一支持的模型,为商业智能系统服务的各业务领域提供预测种结构化或规划良好的环境。4( )数据集市。数据集市是为部门范围级别的决策支持应用而设计的,其数据模型设计和数据组织上更多地服务于一个部门的信息需求。性决策支持的方法、工具和过程。( 9)信息门户(Ente甲riselorfnmationpotral,Elp):为使数据仓库的使用者可以根据自己的需要获得想要的信息,需要从界面、应用系统交互等角度进行门户的建设规可以归结为以下的功5( )操作型数据存储区。操作型数据存储区(opear-划。如果将这些功能模型进行抽象,tionalDatastore,ODS)是业务系统和DW之间更偏向业务能层次:系统的数据存储区域。①集成: 包括信息的集成、人的集成和流程的集成。②内容管理:对现有信息实现统一的目录分类管理 6( )元数据。元数据啊etaat)a通常定义为“关于数据的数据”,是描述和管理数据仓库自身内容对象、用来表示(Categoirzation)。包括结构化数据和非结构化信息的分类、数据项的意义及其在系统各组成部件之间的关系的数据。编目、摘要、审核和发布。数据仓库所提供的“统一的企业级的信息视图”能力,主要③嫂索: 分类和搜索是组织和获取信息的紧密联系的就是靠元数据来体现。实现元数据管理的主要目标就是使两个方面。企业内部元数据的定义标准化。数据仓库的维护工具可以④以人为本的核心安全架构: 支持统一面向自然人的根据元数据完成数据的抽取、清洗和转换,并做适度的汇用户身份认证,统一用户的访问权限控制和统一用户资源总,数据仓库的元数据包括:管理,实现单次登录就可以访问所有相关信息资源是门户江) 数据资源:包括数据源模型,描述源数据属性及业的一个重要功能。务含义,源数据到数据仓库的映射关系;②数据组织: 数据仓库、数据集市表的结构、属性及业务含义,结构等;③数据应用: 查询与报表输出格式描述、OLAP、数据挖掘等的数据模型的信息展现、商业术语;16/CH小胜乃魂鸿入鸿GE州王NTI入下OR州叭刀0入佗片刀ON 即信息门户的数据和应用可以根据每一个⑤个性化:人的要求来配置,为用户提供个性化的应用界面,提高员工工作效率,增强对用户的亲和力和吸引力。⑥可访问性: 在门户中,用户可以在安全机制的保护下,在任何时间任何地点方便地访问企业的信息和应用,企业管理信息化完成对信息和数据的处理和提交,保证企业的业务运转永不停顿。⑦协作与共享: 提供同事间、部门间、企业间、客户和厂商间的协作和交互。⑧管理和调度: 可以实现日常性的信息采集和分送的调度和管理维护。信息门户实施后, 员工日常需要的各个应用和信息集中展现在员工的桌面。只要在统一的信息访问人口进行一程中,如何真正地实现元数据的驱动则不是一件容易的事情,由于受传统程序开发思想的影响,很多开发者对需求问题的解决更多地依赖于程序设计,这样使得很多控制逻辑很难被抽象出来,因此也难于把数据的处理过程标准化、规范化,这种以程序驱动的方式很容易把所谓的元数据驱动流于形式。商业智能的实施原则如下: ()1总体规划原则:整个项目建设应该统一进行规划,次登录的身份验证,便可真正地实现信息一站式服务。建立一个能够支持企业长期发展的总体系统架构,为将来3商业智能的实施的应用打下坚实的基础。 商业智能的实施主要有3类风险:技术风险、工程管( )2分阶段、循序渐进的原则:任何一个项目的实施都理风险和业务风险。应对商业智能项目风险的最好方法是是一个发现问题,解决问题,积累经验,又遇到新问题,再采用一套成熟的方法学似ehtoodofg刃,方法学是人们在数解决,再积累的循序渐进的过程。据仓库构建实践中所积累的成功和失败的经验的总结。商( )3实用原则:尽可能用统一、简单、易于使用的方式业智能项目是一个需要不断优化的循环过程。商业智能在来实现。需求的环节会更加依赖于用户的思维习惯和认识水平,商 4()知识原则:由于商业智能涉及的技术比较新,企业业智能项目具有长期性和艰巨性。必须在实施过程中结合专家培训和服务,逐步培养出自己商业智能的实施方法有3种方式: 的开发、应用人员,是一个知识积累的过程。( 1)自上而下。全局考虑,全面实施,建立适合企业信4商业智能的意义息共性需求的完整的数据模型,然后从业务运营系统中提 传统的业务处理系统环境下,业务人员要获取存储在取数据,进行数据的清洗、合并、规范化和合理化,并加载计算机系统内的业务数据,需要通过IT技术人员编制相到数据仓库中,形成企业统一的数据集成平台,最后可以应的报表程序来实现。报表作为一种固定格式的数据展现根据部门个性需要将数据仓库的数据分发到面向主题的方式,能展现的可能只是事实的一个侧面,当决策人员需数据集市中。优点包括:企业统一的数据集成平台;集中化要从数据中了解事实的全貌的时候,他们必须在头脑中对的控制管理;数据容易分发到各个数据集市中。缺点包括:种类繁多的报表里许多相关的数据进行融汇与整合,当数开发过程复杂,费用高;开发时间长,难以满足快速变化的据的规模和种类越来越多的时候,这种工作毫无疑问也将业务需求;需要进行大量的业务需求分析,需要大量的资会越来越繁重。商业智能的数据整合工作能帮助决策人员源;结构比较僵化,比较难以扩展。从繁重的数据整合工作中出来,迅速地从各个侧面读( )2自下而上。根据特定的业务主题,分部门考虑,分懂数据,使他们能腾出精力更加深人地研究问题的本质,部门实施,在很短的时间内实现部门级的数据集市,多个这样既能提高决策的效率,又能通过对数据多角度多层次数据集市组成企业联邦制的数据仓库。优点包括:可以并的分析得到更深人的洞察能力。运用商业智能后,企业内行开发;见效快;分散化的资源和管理控制。缺点包括:很的信息都日常性地保存到企业的数据仓库中,以备决策者难协调各个数据集市的建设;可能存在着部门之间的政治做决策时对信息访问的需要。通过非常简单的方式访问企斗争和数据集市归属问题;多种数据源采集系统,可能造业数据仓库,就可以访问到在决策过程中需要的所有信成对业务系统的冲击和数据的不一致。息,而且这些信息的访问界面可以是为其需要量身定造( )3元数据驱动的实施方法。元数据管理在商业智能的,可以在单一的个性化的界面内迅速找到与事件相关的项目开发建设中有很重要的作用。元数据驱动、螺旋上升所有信息,非现场地了解事件的全程,决策所需要的信息的数据仓库建立的过程就是“建立元数据—构造数据仓的获取过程可以缩短到小时级别,甚至是分钟级别,并且库集市”的不断循环、不断上升的过程,由于信息获取过程中完全的自动化和规范化,降低了由于 元数据驱动的数据仓库开发过程可以细分为以下阶人工信息采集过程中所无法避免的信息残缺和误差,获取段:信息的准确性得到有力的保证。・ ①建立元数据:包括定义元数据的数据源;定义元数据的内容和属性;定义元数据使用规则;声明元数据联合主要参考文献使用的规则。 ②构造数据仓库糜市:基于元数据进行数据抽聊清没阵专匆聚合功目载乃于布;基于元数据进行前端应用界面定川李艳.商业智能是一种解决方案【N〕.中国计算机用户,2030一11-制。03 这种开发方式优点包括:建立企业数据的统一视图;〔2〕Ercisepelry.企业数据仓库规划、建立与实现【Ml.陈武,袁国忠有统一的元数据管理;具有灵活可扩展的的体系结构;分译.北京: 人民邮电出版社,2创X).步式开发,螺旋式上升,既能快速看到效果,又能保证系统[3」IBM公司.IBM商业智能解决方案综述〔R」.2伽吟.的连续性、一致性。缺点就是如何真正实现这种方式,提取仁4」【美]W:HInmon.建设数据仓库【M〕.王志海,林友芳译北京:机和维护元数据并不是一件很难的事情,而在实际的实施过械工业出版社, 2003.C于刀入冷八咬冷刊八GE材ENTIN万OR州rA丁10入佗片刀ON/17