一、數(shù)據(jù)模型
1.數(shù)據(jù)模型的三要素
。1)數(shù)據(jù)結構 數(shù)據(jù)結構是所研究的對象類型(Object Type)的集合。這些對象和對象類型是數(shù)據(jù)庫的組成成分。一般可分為兩類:一類是與數(shù)據(jù)類型、內(nèi)容和其它性質有關的對象;一類是與數(shù)據(jù)之間的聯(lián)系有關的對象。前者如網(wǎng)狀模型中的數(shù)據(jù)項和記錄,關系模型中的域、屬性和關系等。后者如網(wǎng)狀模型中的關系模型。
在數(shù)據(jù)庫領域中,通常按照數(shù)據(jù)結構的類型來命名數(shù)據(jù)模型,進而對數(shù)據(jù)庫管理系統(tǒng)進行分類。如層次結構、網(wǎng)狀結構和關系結構的數(shù)據(jù)模型分別稱作為層次模型、網(wǎng)狀模型和關系模型。相應地,數(shù)據(jù)庫分別稱作為層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫和關系數(shù)據(jù)庫。
。2)數(shù)據(jù)操作 數(shù)據(jù)操作是指對各種對象類型的實例(或值)所允許執(zhí)行的操作的集合,包括操作及有關的操作規(guī)則。在數(shù)據(jù)庫中,主要的操作有檢索和更新(包括插入、刪除、修改)兩大類。數(shù)據(jù)模型定義了這些操作的定義、語法(即使用這些操作時所用的語言)。
數(shù)據(jù)結構是對系統(tǒng)靜態(tài)特性的描述,而數(shù)據(jù)操作是對系統(tǒng)動態(tài)特性的描述。兩者既有聯(lián)系,又有區(qū)別。
。3)數(shù)據(jù)的約束條件 數(shù)據(jù)的約束條件是完整性規(guī)則的集合。完整性規(guī)則是指在給定的數(shù)據(jù)模型中,數(shù)據(jù)及其聯(lián)系所具有的制約條件和依存條件,用以限制符合數(shù)據(jù)模型的數(shù)據(jù)庫的狀態(tài)以及狀態(tài)的變化,確保數(shù)據(jù)的正確性、有效性和一致性。
2.概念模型
數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)的核心和基礎。每個DBMS軟件都是基于某種數(shù)據(jù)模型的。為了把現(xiàn)實世界中的具體事物或事物之間的聯(lián)系表示成DBMS所支持的數(shù)據(jù)模型,人們首先必須將現(xiàn)實世界的事物及其之間的聯(lián)系進行抽象,轉換為信息世界的概念模型;然后將信息世界的概念模型轉換為機器世界的數(shù)據(jù)模型。也就是說,首先把現(xiàn)實世界中的客觀對象抽象成一種信息結構。這種信息結構并不依賴于具體的計算機系統(tǒng)和DBMS。然后,再把概念模型轉換為某一計算機系統(tǒng)上某一DBMS所支持的數(shù)據(jù)模型。因此,概念模型是從現(xiàn)實世界到機器世界的一個中間層次。
現(xiàn)實世界的事物反映到人的大腦之中,然后人們開始認識這些事物,經(jīng)過選擇、命名、分類和組織等抽象工作之后形成概念模型,并進入到信息世界。
·用戶(user) 關心的是現(xiàn)實世界中的事物、事物的屬性及其相互關系。例如,用戶可能關心他的顧客及其屬性,如顧客地址、銀行帳號等等。用戶也關心自己的定貨帳目,如誰訂的貨、訂的什么和訂多少等等。
·系統(tǒng)分析員(analyst) 同樣也關心現(xiàn)實世界,但是系統(tǒng)分析員需要分析用戶的信息需求。作為需求分析的結果,分析員必須以文檔的形式對需求進行結構化的描述;這個文檔就是信息模型。
·實體(Entity) 實體是構成數(shù)據(jù)庫的基本元素。實體是指一個存在的東西以區(qū)別這個東西所具有的屬性和這個東西與其它東西的聯(lián)系。實體可以是人,也可以是物;可以是實際對象,也可以是概念;可以是事物本身,也可以是指事物之間的聯(lián)系。
·屬性(Attribute) 一個實體可以由若干個屬性來刻畫。屬性是相對實體而言的,是實體所具有的特性。
·關鍵字(Key) 能唯一地標識實體的屬性的集合稱為關鍵字(或碼)。
·域(Domain) 屬性的取值范圍稱作域。
·實體型(Entity Type) 一類實體所具有的共同特征或屬性的集合稱為實體型。一般用實體名及其屬性來抽象地刻畫一類實體的實體型。
·實體集(Entity Set) 同型實體的集合叫實體集。例如,學生就是一個實體集。實體集的名即是實體型。對于學生和(學號、姓名、年齡、系、年級)均是實體型,而學生是對實體型(學號、姓名、年齡、系、年級)所起的名稱,兩者是指同一客觀對象。但本科生和研究生可以為相同實體型,而實體集不同。
·聯(lián)系(Relationship) 現(xiàn)實世界的事物之間是有聯(lián)系的。一般存在兩類聯(lián)系:一是實體內(nèi)部的組成實體的屬性之間的聯(lián)系,二是實體之間的聯(lián)系。在考慮實體內(nèi)部的聯(lián)系時,是把屬性看作為實體。
一般來說,兩個實體之間的聯(lián)系可分為三種:
。1)一對一(1∶1)聯(lián)系 若對于實體集A中的每一個實體,實體集B中至多有唯一的一個實體與之聯(lián)系,反之亦然,則稱實體集A與實體集B具有一對一聯(lián)系,記作1∶1。
(2)一對多(1∶n)聯(lián)系 若對于實體集A中的每個實體,實體集B中有n個實體(n≥0)與之聯(lián)系;反之,對于實體集B中的每一個實體,實體集A中至多只有一個實體與之聯(lián)系,則稱實體集A與實體集B有一對多聯(lián)系,記為1∶n。
相應地有多對一(n∶1)聯(lián)系 多對一聯(lián)系,從本質上說,是一對多聯(lián)系的逆轉。其定義同一對多聯(lián)系類似,不再贅述。
。3)多對多(m∶n)聯(lián)系 若對于實體集A中的每一個實體,實體集B中有n個實體(n≥0)與之聯(lián)系;反之,對于實體集B中的每一個實體,實體集A中也有m個實體(m≥0)與之對應,則稱實體集A與實體集B具有多對多聯(lián)系,記作m∶n。實質上,多對多聯(lián)系是任意一種聯(lián)系。另外,同一實體集內(nèi)的各個實體間也可以有各種聯(lián)系。
概念模型的表示方法最常用的是實體一聯(lián)系方法(Entity-Relationship Approach),簡稱E-R方法。該方法是由P.P.S.Chen在1976年提出的。E-R方法用E-R圖來描述某一組織的概念模型。在這里僅介紹E-R圖的要點。在E-R圖中:
。1)長方形框表示實體集,框內(nèi)寫上實體型的名稱。
。2)用橢圓框表示實體的屬性,并用有向邊把實體框及其屬性框連接起來。
(3)用菱形框表示實體間的聯(lián)系,框內(nèi)寫上聯(lián)系名,用無向邊把菱形框及其有關的實體框連接起來,在旁邊標明聯(lián)系的種類。如果聯(lián)系也具有屬性,則把屬性框和菱形框也用無向邊連接上。
3.三種主要的數(shù)據(jù)模型
實際DBMS所支持的數(shù)據(jù)模型主要有三種:
·層次模型(Hierarchical Model)
·網(wǎng)狀模型(Network Model)
·關系模型(Relational Model)
其中,關系模型是當前DBMS所支持的數(shù)據(jù)模型的主流。90年代運行的DBMS幾乎都是基于關系模型的。層次模型和網(wǎng)狀模型統(tǒng)稱為非關系模型。非關系模型的結構可以和圖論中的圖相對應,比較直觀,但在理論上不完備,實現(xiàn)效率較低,故此目前很少用。但是最近,層次模型在研究面向對象的DBMS中已得到重視。
在關系模型中,數(shù)據(jù)在用戶的觀點中(或在用戶視圖中)的邏輯結構是一張二維表(Table)。
·關系(Relation),對應于平常講的一張表。
·元組(Tuple),表中的一行。
·屬性(Attribute),表中的一列稱為一個屬性,給每一列起一個名,稱為屬性名。這一列或這個屬性所有可能取的值的集合稱為這個屬性的值域(Domain),值域中的一個元素叫做這個屬性的值。
·主關鍵字(Primary Key Attribute或Primary Key),是指能唯一標識一個元組的一個或一組屬性。
·分量(Attribute Value),是指元組中的一個屬性值。
·關系模式(Relational Schema),是對關系的描述,一般用關系名(屬性名1,屬性名2,…,屬性名n)來表示。
同層次模型和網(wǎng)狀模型相比較,關系模型具有下列特點:
。1)概念單一 在關系模型中,無論是實體還是實體之間的聯(lián)系都用關系來表示。
在關系模型中,在用戶的觀點中,數(shù)據(jù)的邏輯結構就是表,也只有這唯一的概念。在非關系模型中,用戶要區(qū)分記錄型與記錄型之間的聯(lián)系兩個概念;當環(huán)境復雜時,數(shù)據(jù)結構異常復雜,難以掌握。而關系模型,由于概念單一,可以變復雜為直觀、簡單,易學易用。
。2)規(guī)范化 所謂關系規(guī)范化是指在關系模型中,每一個關系都要滿足一定的條件要求。這些條件被稱為規(guī)范條件。
對于關系,一個最基本的規(guī)范條件是,要求關系中的每一個屬性(或分量)均是不可分的數(shù)據(jù)項;也就是說不允許表中有表,表是不可嵌套的。
(3)在關系模型中,用戶對數(shù)據(jù)的操作的輸入和輸出都是表,也就是說,用戶通過操作舊表而得到一張新表。
總之,關系模型概念簡單,結構清晰,用戶易學易用,有嚴格的以數(shù)學為基礎的關系理論作指導,便于DBMS的實現(xiàn);陉P系的DBMS簡化了應用程序員的工作,便于數(shù)據(jù)庫應用系統(tǒng)的設計和維護。故此,關系模型自誕生以后就得到了迅速的發(fā)展,成為應用最為廣泛的、唯一的數(shù)據(jù)模型。
希望與更多計算機等級考試的網(wǎng)友交流,請進入計算機等級考試論壇
更多信息請訪問:考試吧計算機等級考試欄目
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |