探索BI系统搭建的必要性与AI技术的应用潜力
986
2022-05-28
上一期我们聊了数据库和数据库管理系统。
这一期我们再来扒一扒数据库的发展历史。
受硬件和软件发展水平的影响,数据库发展阶段大致划分为如下几个阶段:人工管理阶段、文件系统阶段、数据库系统阶段、高级数据库阶段。
人工管理阶段
年代 上世纪50年代中期以前 。
背景 计算机主要用于科学计算 。
硬件上,外存只有磁带、卡片、纸带,没有磁盘等直接存取的存储设备 。
软件上,没有操作系统、没有管理数据的软件。
数据处理方式是批处理。
因为无系统管理软件,数据与程序不具有独立性 。数据的组织方式由程序员自行设计。
应用程序与数据的关系:一 一对应,数据面向应用程序。
文件系统阶段
年代 从上世纪50年代后期到60年代中期
背景 计算机不仅用于科学计算,还大量用于管理。
硬件上,外存储器有了磁盘、磁鼓等直接存取的存储设备;
软件上,操作系统中已经有了专门的管理数据软件(文件系统)。
数据处理方式有文件批处理和联机实时处理。
因此这阶段依然存在数据和程序缺乏独立性 、增删数据困难的缺点。
文件系统的三个缺陷:数据冗余性、 数据不一致性、数据联系弱。
数据库系统阶段
年代 上世纪60年代后期开始。
背景 计算机更大规模的用于管理,数据量急剧增长,数据的共享要求越来越强;
硬件上,外存储器有了大容量的磁盘;
软件价格上升,硬件价格下降;
数据处理方式上,联机实时处理要求更多了,并开始提出和考虑分布处理。
特点 面向全组织的复杂的数据结构(结构化、集成化);
数据冗余度小,易扩充;
引进DBMS,实现了数据的:独立性、安全性、完整性、并发控制
数据的最小存取单位是数据项;实现数据共享的最小单位是数据项。
总结:
一、人工管理阶段:特点
数据的管理者:人
数据面向的对象:某一应用程序
数据的共享程度:无共享,冗余度极大
数据的独立性:不独立,完全依赖于程序
数据的结构化:无结构
数据控制能力:应用程序自己控制
二、文件系统阶段:特点
数据的管理者:文件系统
数据面向的对象:某一应用程序
数据的共享程度:共享性差,冗余度大
数据的独立性:独立性差
数据的结构化:记录内有结构,整体无结构
数据控制能力:应用程序自己控制
三、数据库系统阶段:特点
数据的管理者:数据库管理系统
数据面向的对象:整个应用系统
数据的共享程度:共享性高,冗余度小
数据的独立性:具有高度的物理独立性和逻辑独立性
数据的结构化:整体结构化,用数据模型描述
数据控制能力:由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力
(编者注:通过理解上一期所说的数据库和数据库管理系统的概念,我们不难总结出:人工管理阶段和文件系统阶段的数据库只是存放数据的库,而数据库系统阶段和高级数据库阶段,则不仅有库,而且已经是DBMS了)
--------------------------------------------我是华丽丽的分割线-----------------------------------------------------------------------------
进入数据库系统阶段后,DBMS的发展先后发展出了网状型数据库、层次型数据库和关系数据库。
网状型数据库
最早出现的网状型DBMS数据库,是美国通用电气公司Bachman等人在1961年开发成功的IDS(Integrated DataStore)。
1961年通用电气公司(General ElectricCo.)的Charles Bachman ;成功地开发出世界上第一个网状DBMS也是第一个数据库管理系统——集成数据存储(Integrated DataStore IDS),奠定了网状数据库的基础,并在当时得到了广泛的发行和应用。
IDS ,具有数据模式和日志的特征。但它只能在GE主机上运行,并且数据库只有一个文件,数据库所有的表必须通过手工编码来生成。之后,通用电气公司一个客户——BF Goodrich Chemical 公司最终不得不重写了整个系统。并将重写后的系统命名为集成数据管理系统(IDMS)。
1973年Cullinane公司(也就是后来的Cullinet软件公司),开始出售Goodrich公司的IDMS改进版本,并且逐渐成为当时世界上最大的软件公司。
网状数据库模型对于层次和非层次结构的事物都能比较自然的摸拟,在关系数据库出现之前网状DBMS要比层次DBMS用得普遍。在数据库发展史上,网状数据库占有重要地位。
特点:它反映着现实世界中实体间更为复杂的联系,其基本特征是,结点数据间没有明确的从属关系,一个结点可与其它多个结点建立联系。
如图所示的四个城市的交通联系,不仅是双向的而且是多对多的。
层次型数据库
层次型DBMS是紧随网络型数据库而出现的,最著名最典型的层次数据库系统是IBM 公司在1968 年开发的IMS(Information Management System)。IMS,一种适合其主机的层次数据库。这是IBM公司研制的最早的大型数据库系统程序产品。从60年代末产生起,如今已经发展到IMS15,提供群集、N路数据共享、消息队列共享等先进特性的支持。这个具有50年历史的数据库产品在如今的WWW应用连接、商务智能应用中扮演着新的角色。
(编者注:特意查到的IMS官网奉上。https://www.ibm.com/it-infrastructure/z/ims)
层次型数据库图示如下:
关系数据库
网状数据库和层次数据库已经很好地解决了数据的集中和共享问题,但是在数据独立性和抽象级别上仍有很大欠缺。用户在对这两种数据库进行存取时,仍然需要明确数据的存储结构,指出存取路径。而后来出现的关系数据库较好地解决了这些问题。
主流的关系数据库有:Oracle(中文名叫甲骨文)公司的Oracle数据库;IBM(中文名称是国际商务机器公司)的DB2,Informix;微软的SQL Server,Access;Sybase公司的Sybase;以及开源数据库MySQL、Postgres等。
发展趋势:
随着信息管理内容的不断扩展,出现了丰富多样的数据模型(层次模型,网状模型,关系模型,面向对象模型,半结构化模型等),新技术也层出不穷(数据流,Web数据管理,数据挖掘等)。每隔几年,国际上一些资深的数据库专家就会聚集一堂,探讨数据库研究现状,存在的问题和未来需要关注的新技术焦点。
各种新型的数据库技术:演绎数据库、主动数据库、基于逻辑的数据库、时态数据库、模糊数据库、并行数据库、多媒体数据库、内存数据库……….
数据库发展大事记:
1951:Univac系统使用磁带和穿孔卡片作为数据存储。
1956:IBM公司在其Model 305 RAMAC中第一次引入了磁盘驱动器
1961:通用电气(GE)公司的Charles Bachman开发了第一个数据库管理系统——IDS
1969: E.F. Codd发明了关系数据库。
1973:由John J.Cullinane领导Cullinane公司开发了 IDMS——一个针对IBM主机的基于网络模型的数据库。
1976:Honeywell公司推出了Multics Relational Data Store——第一个商用关系数据库产品。
1979:Oracle公司引入了第一个商用SQL关系数据库管理系统。
1983:IBM推出了DB2数据库产品。
1985:为Procter & Gamble系统设计的第一个商务智能系统产生。
1991:W.H.“Bill” Inmon发表了”构建数据仓库”。
前期汇总:
【小资说库】第1期 什么是数据库
存储
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。