• 沒有找到結果。

仅仅几年以前,这种被称为"商务智能"的技术,还是大公司的专利。但随着计 算机处理器、存储器的价格不断下降和软件质量的不断上升,这种技术成了商业 界的主流。大大小小的公司,都收集了前所未有的大量数据。过去,这些数据存 储在不同的系统当中,如财务系统、人力资源系统和客户管理系统,老死不相往来。

现在,这些系统彼此相连,通过"数据挖掘"的技术,可以获得一幅关于企业运 营的完整图景,这被称为:一致的真相 (A

single version of the

truth) 。商务智能 提高了商业运营的效率,帮助了企业总结发展过程中的模式,并改善了企业预测 未来的能力。

信息技术产业把商务智能视为对 20 世纪上半叶企业会计服务、下半叶计算机服 务的一个自然承接,正在争相涌入这个领域。爱森哲、普华永道、 IBM 、 SAP 都 在这个领域投入巨资。技术平台的提供商甲骨文、 Informatica 、 TI8CO 、 SAS 、 EMC 也从中赢利。 IBM 更是相信:随着传感器在城市交通、医疗健康中的应用,

商务智能将成为其业务增长的]黄梁柱。 01

一一《经济学人>>, 2010 年 2 月 25 日特别报道

联邦政府这个数据帝国,虽然拥有的数据比任何公司、企业都多,但和私 营领域相比,在信息技术的应用上,还是明显落后一步、慢了几拍。

2009 年 3 月,奥巴马就任后的第二个月,就在联邦政府之内设立了一个 全新的职位:首席信息官(

Chief Information Officer)

,并任命来自印度的移 民昆德拉 (Vivek Kundra) 为第一任联邦政府首席信息官。昆德拉在公共和私 营两个领域都有广泛的经历,他走马上任之后,曾发表过第一感受:联邦政府 信息技术的装备和应用,和一流的商业公司相比,就好像手摇电话摆在了线条 圆润、光彩照人的苹果手机旁边,不可同日而语。

当然,这并不奇怪。现代政治学的基本常识告诉我们:由于无法引人有效 的竞争机制,政府注定难逃低效的命运。美国联邦政府也不例外。

收集数据、分析数据、发布数据,这一系列和数据有关的信息技术,在商 业界其实有个更时尚、更响亮的名字:商务智能。

在商务智能的技术大潮当中,美国联邦政府的做法,只是几朵小小的浪花,

公司、大学才是这个领域真正的弄潮儿和领航人。

这股技术浪潮,也在美国起源。

起源:从数据到知识的挑战和跨越

信息消费了什么是很明显的:它消费的是信息接受者的注意力。信息越丰富,就 会导致注意力越医乏……信息并不匮乏,医乏的是我们处理信息的能力。我们有 限的注意力是组织活动的主要瓶颈。 02

一一一赫伯特·西蒙 美国经济学家、政治学家、人工智能的创始人之一 1 1973 年

1946 年,人类历史上第一台电子计算机在美国费城问世。 03 来自匈牙利的 移民冯-诺伊曼是这台计算机的主要设计者,他被后世称为"计算机之父"。

赫伯特·西蒙(

1916-2001 )

(Herbert

Simon) 教授出版了《行政组织的决策过程》

一书。在这本被后世视为经典的著作里,他指出,人 类的理性是有限的,因此所有的决策都是基于有限理性

(Bounded

Rationality) 的结果。这位天才科学家继而提

出,如果能利用存储在计算机里的信息来辅助决策,人

统面对的老问题:如何将数据、信息转化为知识,扩大人类的理性,辅助决策?

从数据到知识,这个跨越,人类用了半个多世纪。

在半个多世纪的漫长过程中,决策支持系统曾经一度因为缺乏有效的数据 组织方式而徘徊不前。直到上世纪 90 年代,由于若干新技术的出现,打破了 瓶颈商务智能"的概念才横空出世。随后,其发展取得了前所未有的加速度,

从数据、信息到知识的演变

数据、信息和知识的区别和联系

数据价值

数据规模

在本世纪第一个十年蓬勃向上。今天,回头考察这些新技术的一一出现,可以 清楚地看到商务智能的产业链条不断向前延伸的轨迹。

这个轨迹的起点当然就是计算机。计算机,是硬件和软件相结合的产物。

它的发明,是诸多不同领域的科学家共同努力的结果。冯·诺伊曼其实是一名 数学家,他之所以被称为"计算机之父其最大的贡献之一,在于他明确了 计算机内部的数据组织形式:二进制。

二进制的引进,解决了在没有"情感、智能和生命"的物理机器中表达、计算、

传送数据的最大难题,有了二进制,软件的运行才有了支点。

如前文所述,软件是由程序和数据组成的。二进制的确定,解决了数据在 计算机内部传送"理解"和"流动"的问题,但当数据在计算机内部累积得越 来越多的时候,如何快速地组织、存储和读取数据又成为新的挑战。

计算机科学家一直在研究数据在软件内部的最佳组织方式。 1970 年,

IBM

的研究员埃德加-科德 (Edgar Codd) 发明了关系型数据库,成为软件发展历 史上一个跨越性的里程碑。

此前,数据库的组织结构以网状、层级制为主,复杂多变,程序和数据之 间你中有我、我中有你,彼此有很强的依赖性。科德提出的关系型数据库具有 结构化高、冗余度低、独立性强等优点,彻底把软件中的程序和数据分立开来。

从此,软件的发展成了"两条腿"走路,程序和数据在各自的轨道上自由斧跑。

科德后来又总结出构建关系型数据库的"黄金十二定律把理论扎扎实 实地推向了实践,关系型数据库开始得到大范围地推广,引发了一场软件领域 的革命。科德也因此获得 1981 年的图灵奖。

此后,大型软件,即大型信息管理系统的应用一日千里、遍地开花。

这些信息系统的建立和运行,使人类从繁杂的重复性劳动当中解放出来,

大大提高了商业效率。但这些信息系统,都是针对特定的业务过程、处理离散 事务的"运营式"信息系统。

所谓"运营式系统是指为提高日常工作的效率而设计的系统,数据在 其中的作用,是→个个商务流程的记录,数据在这些系统内不断累积的结果,

仅仅用于查询,而不是分析。

上个世纪 90 年代,面对信息管理系统的普及、各行各业数据记录的激增,

管理大师彼得·德鲁克 (Peter Drucker) 曾发出慨叹:迄今为止,我们的系统产 生的还仅仅是数据,而不是信息,更不是知识! 05

怎样从各个独立的信息系统中提取、整合有价值的数据,从而实现从数据 到信息、从信息到知识、从知识到利润的转化?这个要求,随着信息管理系统 的普及,变得越来越迫切。企业的规模越来越庞大、组织越来越复杂,市场更 加多变、竞争更加激烈,信息是否及时准确、决策是否正确合理,对组织的兴 衰存亡影响越来越大,一步走错,可能全盘皆输。

由于实业界这些迫切的需要,决策支持系统的旧问题又重新占据了顶尖科 学家的大脑。

商务智能的"幽灵"开始徘徊……

结踊:数据仓库之厚积薄发

岳不群叹了口气,缓缓地道"三十多年前,咱们气宗是少数,剑宗中的师伯、师 叔占了大多数。再者,剑宗功夫易于速成,见效极快。大家都练十年,定是剑宗 占上风;各练二十年,那便是各擅胜场,难分上下;要到二十年之后,练气宗功 夫的才渐渐地越来越强;到得三十年时,练剑宗功夫的便再也不能望气宗之项背了。

然而要到二十余年之后,才真正分出高下,这二十余年中双方争斗之烈,可想而知。"

一一金庸, <<笑傲江湖》第九章, 1967 年

决策支持系统面临的"瓶颈式"难题,是如何有机地聚集、整合多个不同 运营信息系统产生的数据。对这个问题的关注起源于美国计算机科学研究的另 一所重镇:麻省理工学院。和卡内基梅隆大学一起,这两所大学先后为现代商 务智能的发展奠定了主要的基石。

20 世纪 70 年代,麻省理工学院的研究人员第一次提出,决策支持系统和

运营信息系统截然不同,必须分开,这意味着要为前者设计独立的数据存储结 构。但受限于当时的数据存储能力,该研究在确立了这一论点后便停滞不前。

但这个研究如灯塔般为实业界指明了方向。 1979 年,一家以决策支持系 统为己任、致力于构建独立数据存储结构的公司 Teradata 诞生了。 Te凡是太 字节,其大小为 240, Teradata 的命名表明了公司处理海量数据的决心。 1983 年,

该公司利用并行处理技术为美国富国银行 (Wells

Fargo

Bank) 建立了第一个决 策支持系统。这种先发优势令 Teradata 至今一直雄踞在数据行业的龙头榜首。

另一家信息技术的巨头一一国际商业机器公司 (IBM) 也在为集成企业内 不同的运营系统大伤脑筋。越来越多的 IBM 客户要面对多个分立系统的数据 整合问题,这些处理不同事务的系统,由于不同的编码方式和数据结构,像一 个个信息孤岛,处于老死不相往来的状态。 1988 年,为解决企业的数据集成 问题, IBM 公司的两名研究员 (Barry Devlin 和 Paul Murphy) 创造性地提出 了一个新的术语:数据仓库 (Data Warehouse) 。

一声惊雷,似乎宣告了数据仓库的诞生。可惜 IBM 在首创这个概念之后,

也停步不前,只把它当做一个花哨的新名词用于市场宣传,而没有乘胜追击、

进一步提出实际的架构和设计。 IBM 很快在这个领域丧失其领先地位 ;2008 年,

IBM 甚至通过兼并 Cognos 才使自己在商务智能的市场上重占一席之地,这是 后话。

但这之后,更多的信息技术企业垂涎于数据仓库的"第一桶金纷纷开 始尝试搭建实验性的数据仓库。

又是几年过去, 1992 年,尘埃终于落定。比尔·恩门 (Bill Inmon) 出版了《数 据仓库之构建))

(Building the Data

阳rehouse) 一书,第一次给出了数据仓库

又是几年过去, 1992 年,尘埃终于落定。比尔·恩门 (Bill Inmon) 出版了《数 据仓库之构建))

(Building the Data

阳rehouse) 一书,第一次给出了数据仓库

相關文件