點(diǎn)擊查看2016年全國計算機(jī)四級數(shù)據(jù)庫考試重點(diǎn)匯總
一、數(shù)據(jù)模型
1.數(shù)據(jù)模型的三要素
(1)數(shù)據(jù)結(jié)構(gòu) 數(shù)據(jù)結(jié)構(gòu)是所研究的對象類型(Object Type)的集合。這些對象和對象類型是數(shù)據(jù)庫的組成成分。一般可分為兩類:一類是與數(shù)據(jù)類型、內(nèi)容和其它性質(zhì)有關(guān)的對象;一類是與數(shù)據(jù)之間的聯(lián)系有關(guān)的對象。前者如網(wǎng)狀模型中的數(shù)據(jù)項和記錄,關(guān)系模型中的域、屬性和關(guān)系等。后者如網(wǎng)狀模型中的關(guān)系模型(set type)。在數(shù)據(jù)庫領(lǐng)域中,通常按照數(shù)據(jù)結(jié)構(gòu)的類型來命名數(shù)據(jù)模型,進(jìn)而對數(shù)據(jù)庫管理系統(tǒng)進(jìn)行分類。如層次結(jié)構(gòu)、網(wǎng)狀結(jié)構(gòu)和關(guān)系結(jié)構(gòu)的數(shù)據(jù)模型分別稱作為層次模型、網(wǎng)狀模型和關(guān)系模型。相應(yīng)地,數(shù)據(jù)庫分別稱作為層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫。
(2)數(shù)據(jù)操作 數(shù)據(jù)操作是指對各種對象類型的實例(或值)所允許執(zhí)行的操作的集合,包括操作及有關(guān)的操作規(guī)則。在數(shù)據(jù)庫中,主要的操作有檢索和更新(包括插入、刪除、修改)兩大類。數(shù)據(jù)模型定義了這些操作的定義、語法(即使用這些操作時所用的語言)。數(shù)據(jù)結(jié)構(gòu)是對系統(tǒng)靜態(tài)特性的描述,而數(shù)據(jù)操作是對系統(tǒng)動態(tài)特性的描述。兩者既有聯(lián)系,又有區(qū)別。
(3)數(shù)據(jù)的約束條件 數(shù)據(jù)的約束條件是完整性規(guī)則的集合。完整性規(guī)則是指在給定的數(shù)據(jù)模型中,數(shù)據(jù)及其聯(lián)系所具有的制約條件和依存條件,用以限制符合數(shù)據(jù)模型的數(shù)據(jù)庫的狀態(tài)以及狀態(tài)的變化,確保數(shù)據(jù)的正確性、有效性和一致性。
2.概念模型
數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)的核心和基礎(chǔ)。每個DBMS軟件都是基于某種數(shù)據(jù)模型的。為了把現(xiàn)實世界中的具體事物或事物之間的聯(lián)系表示成DBMS所支持的數(shù)據(jù)模型,人們首先必須將現(xiàn)實世界的事物及其之間的聯(lián)系進(jìn)行抽象,轉(zhuǎn)換為信息世界的概念模型;然后將信息世界的概念模型轉(zhuǎn)換為機(jī)器世界的數(shù)據(jù)模型。也就是說,首先把現(xiàn)實世界中的客觀對象抽象成一種信息結(jié)構(gòu)。這種信息結(jié)構(gòu)并不依賴于具體的計算機(jī)系統(tǒng)和DBMS。然后,再把概念模型轉(zhuǎn)換為某一計算機(jī)系統(tǒng)上某一DBMS所支持的數(shù)據(jù)模型。因此,概念模型是從現(xiàn)實世界到機(jī)器世界的一個中間層次,F(xiàn)實世界的事物反映到人的大腦之中,然后人們開始認(rèn)識這些事物,經(jīng)過選擇、命名、分類和組織等抽象工作之后形成概念模型,并進(jìn)入到信息世界。
•用戶(user) 關(guān)心的是現(xiàn)實世界中的事物、事物的屬性及其相互關(guān)系。例如,用戶可能關(guān)心他的顧客及其屬性,如顧客地址、銀行帳號等等。用戶也關(guān)心自己的定貨帳目,如誰訂的貨、訂的什么和訂多少等等。
•系統(tǒng)分析員(analyst) 同樣也關(guān)心現(xiàn)實世界,但是系統(tǒng)分析員需要分析用戶的信息需求。作為需求分析的結(jié)果,分析員必須以文檔的形式對需求進(jìn)行結(jié)構(gòu)化的描述;這個文檔就是信息模型。
•實體(Entity) 實體是構(gòu)成數(shù)據(jù)庫的基本元素。實體是指一個存在的東西以區(qū)別這個東西所具有的屬性和這個東西與其它東西的聯(lián)系。實體可以是人,也可以是物;可以是實際對象,也可以是概念;可以是事物本身,也可以是指事物之間的聯(lián)系。
•屬性(Attribute) 一個實體可以由若干個屬性來刻畫。屬性是相對實體而言的,是實體所具有的特性。
•關(guān)鍵字(Key) 能唯一地標(biāo)識實體的屬性的集合稱為關(guān)鍵字(或碼)。
•域(Domain) 屬性的取值范圍稱作域。
•實體型(Entity Type) 一類實體所具有的共同特征或?qū)傩缘募戏Q為實體型。一般用實體名及其屬性來抽象地刻畫一類實體的實體型。
•實體集(Entity Set) 同型實體的集合叫實體集。例如,學(xué)生就是一個實體集。實體集的名即是實體型。對于學(xué)生和(學(xué)號,姓名,年齡,系,年級)均是實體型,而學(xué)生是對實體型(學(xué)號,姓名,年齡,系,年級)所起的名稱,兩者是指同一客觀對象。但本科生和研究生可以為相同實體型,而實體集不同。
•聯(lián)系(Relationship) 現(xiàn)實世界的事物之間是有聯(lián)系的。一般存在兩類聯(lián)系:一是實體內(nèi)部的組成實體的屬性之間的聯(lián)系,二是實體之間的聯(lián)系。在考慮實體內(nèi)部的聯(lián)系時,是把屬性看作為實體。一般來說,兩個實體之間的聯(lián)系可分為三種:
(1)一對一(1∶1)聯(lián)系 若對于實體集A中的每一個實體,實體集B中至多有唯一的一個實體與之聯(lián)系,反之亦然,則稱實體集A與實體集B具有一對一聯(lián)系,記作1∶1。
(2)一對多(1∶n)聯(lián)系 若對于實體集A中的每個實體,實體集B中有n個實體(n≥0)與之聯(lián)系;反之,對于實體集B中的每一個實體,實體集A中至多只有一個實體與之聯(lián)系,則稱實體集A與實體集B有一對多聯(lián)系,記為1∶n。相應(yīng)地有多對一(n∶1)聯(lián)系 多對一聯(lián)系,從本質(zhì)上說,是一對多聯(lián)系的逆轉(zhuǎn)。其定義同一對多聯(lián)系類似,不再贅述。
(3)多對多(m∶n)聯(lián)系 若對于實體集A中的每一個實體,實體集B中有n個實體(n≥0)與之聯(lián)系;反之,對于實體集B中的每一個實體,實體集A中也有m個實體(m≥0)與之對應(yīng),則稱實體集A與實體集B具有多對多聯(lián)系,記作m∶n。實質(zhì)上,多對多聯(lián)系是任意一種聯(lián)系。另外,同一實體集內(nèi)的各個實體間也可以有各種聯(lián)系。概念模型的表示方法最常用的是實體一聯(lián)系方法(Entity-Relationship Approach),簡稱E-R方法。該方法是由P.P.S.Chen在1976年提出的。E-R方法用E-R圖來描述某一組織的概念模型。在這里僅介紹E-R圖的要點(diǎn)。在E-R圖中:
(1)長方形框表示實體集,框內(nèi)寫上實體型的名稱。
(2)用橢圓框表示實體的屬性,并用有向邊把實體框及其屬性框連接起來。
(3)用菱形框表示實體間的聯(lián)系,框內(nèi)寫上聯(lián)系名,用無向邊把菱形框及其有關(guān)的實體框連接起來,在旁邊標(biāo)明聯(lián)系的種類。如果聯(lián)系也具有屬性,則把屬性框和菱形框也用無向邊連接上。
3.三種主要的數(shù)據(jù)模型
實際DBMS所支持的數(shù)據(jù)模型主要有三種:
•層次模型(Hierarchical Model)
•網(wǎng)狀模型(Network Model)
•關(guān)系模型(Relational Model)其中,關(guān)系模型是當(dāng)前DBMS所支持的數(shù)據(jù)模型的主流。90年代運(yùn)行的DBMS幾乎都是基于關(guān)系模型的。層次模型和網(wǎng)狀模型統(tǒng)稱為非關(guān)系模型。非關(guān)系模型的結(jié)構(gòu)可以和圖論中的圖相對應(yīng),比較直觀,但在理論上不完備,實現(xiàn)效率較低,故此目前很少用。但是最近,層次模型在研究面向?qū)ο蟮?/FONT>DBMS中已得到重視。在關(guān)系模型中,數(shù)據(jù)在用戶的觀點(diǎn)中(或在用戶視圖中)的邏輯結(jié)構(gòu)是一張二維表(Table)。
•關(guān)系(Relation),對應(yīng)于平常講的一張表。
•元組(Tuple),表中的一行。
•屬性(Attribute),表中的一列稱為一個屬性,給每一列起一個名,稱為屬性名。這一列或這個屬性所有可能取的值的集合稱為這個屬性的值域(Domain),值域中的一個元素叫做這個屬性的值。
•主關(guān)鍵字(Primary Key Attribute或Primary Key),是指能唯一標(biāo)識一個元組的一個或一組屬性。
•分量(Attribute value),是指元組中的一個屬性值。
•關(guān)系模式(Relational Schema),是對關(guān)系的描述,一般用關(guān)系名(屬性名1,屬性名2,…,屬性名n)來表示。同層次模型和網(wǎng)狀模型相比較,關(guān)系模型具有下列特點(diǎn):
(1)概念單一 在關(guān)系模型中,無論是實體還是實體之間的聯(lián)系都用關(guān)系來表示。在關(guān)系模型中,在用戶的觀點(diǎn)中,數(shù)據(jù)的邏輯結(jié)構(gòu)就是表,也只有這唯一的概念。在非關(guān)系模型中,用戶要區(qū)分記錄型與記錄型之間的聯(lián)系兩個概念;當(dāng)環(huán)境復(fù)雜時,數(shù)據(jù)結(jié)構(gòu)異常復(fù)雜,難以掌握。而關(guān)系模型,由于概念單一,可以變復(fù)雜為直觀、簡單,易學(xué)易用。
(2)規(guī)范化 所謂關(guān)系規(guī)范化是指在關(guān)系模型中,每一個關(guān)系都要滿足一定的條件要求。這些條件被稱為規(guī)范條件。對于關(guān)系,一個最基本的規(guī)范條件是,要求關(guān)系中的每一個屬性(或分量)均是不可分的數(shù)據(jù)項;也就是說不允許表中有表,表是不可嵌套的。
(3)在關(guān)系模型中,用戶對數(shù)據(jù)的操作的輸入和輸出都是表,也就是說,用戶通過操作舊表而得到一張新表。總之,關(guān)系模型概念簡單,結(jié)構(gòu)清晰,用戶易學(xué)易用,有嚴(yán)格的以數(shù)學(xué)為基礎(chǔ)的關(guān)系理論作指導(dǎo),便于DBMS的實現(xiàn);陉P(guān)系的DBMS簡化了應(yīng)用程序員的工作,便于數(shù)據(jù)庫應(yīng)用系統(tǒng)的設(shè)計和維護(hù)。故此,關(guān)系模型自誕生以后就得到了迅速的發(fā)展,成為應(yīng)用最為廣泛的、唯一的數(shù)據(jù)模型。
二、數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu)
1.數(shù)據(jù)庫系統(tǒng)的三級模式結(jié)構(gòu)
數(shù)據(jù)庫管理系統(tǒng)的三級模式結(jié)構(gòu)由外模式、模式和內(nèi)模式組成。外模式(external schema),或子模式(subschema)或用戶模式(user schema),是指數(shù)據(jù)庫用戶所看到的數(shù)據(jù)結(jié)構(gòu),是用戶看到的數(shù)據(jù)視圖。模式(schema)或邏輯模式(logic schema),是數(shù)據(jù)庫中對全體數(shù)據(jù)的邏輯結(jié)構(gòu)和特性的描述,是所有用戶所見到的數(shù)據(jù)視圖的總和。外模式是模式的一部分。內(nèi)模式(internal schema),或存儲模式(storage schema),或物理模式(physical schema),是指數(shù)據(jù)在數(shù)據(jù)庫系統(tǒng)內(nèi)的存儲介質(zhì)上的表示,即對數(shù)據(jù)的物理結(jié)構(gòu)和存取方式的描述。模式描述的是數(shù)據(jù)的全局的邏輯結(jié)構(gòu),決定了DBMS的功能。外模式涉及的僅是局部的邏輯結(jié)構(gòu),是模式的子集,是對模式的調(diào)用。數(shù)據(jù)庫系統(tǒng)的三級模式是對數(shù)據(jù)進(jìn)行三個層次抽象的工具。通過三級模式,把對數(shù)據(jù)的具體組織留給DBMS來完成,使得用戶能在高層次上處理數(shù)據(jù)的邏輯結(jié)構(gòu),而不必關(guān)心數(shù)據(jù)的物理結(jié)構(gòu)。為了實現(xiàn)這三個層次這間的聯(lián)系,DBMS在溝通三級模式中提供了兩個映象:外模式-模式映象模式-內(nèi)模式映象
(1)模式 模式規(guī)定了數(shù)據(jù)庫中全部數(shù)據(jù)的一個邏輯表示或描述形式。模式既不同于內(nèi)模式,也不同于外模式。它比內(nèi)模式抽象,不涉及數(shù)據(jù)的物理結(jié)構(gòu)和存儲介質(zhì)。它與具體的應(yīng)用程序或高級語言無關(guān)。
(2)外模式 外模式是個別用戶的數(shù)據(jù)視圖,即與某一應(yīng)用有關(guān)的數(shù)據(jù)的邏輯表示。
(3)內(nèi)模式 內(nèi)模式是全部數(shù)據(jù)庫的內(nèi)部表示或底層描述,是用來定義數(shù)據(jù)的物理結(jié)構(gòu)和存取方式的。
(4)二級映象 對于同一個模式,可以有任意多個外模式。外模式-模式的映象定義了某個外模式和模式之間的對應(yīng)關(guān)系。這些映象的定義通常包含在各自的外模式中。當(dāng)模式改變時,外模式-模式的映象要做相應(yīng)的改變,以保證外模式的不變性。這是數(shù)據(jù)庫管理員(DBA)的責(zé)任。模式-內(nèi)模式的映象定義了數(shù)據(jù)邏輯結(jié)構(gòu)和存儲結(jié)構(gòu)之間的對應(yīng)關(guān)系。例如,字段的內(nèi)部表示等。當(dāng)數(shù)據(jù)庫的存儲結(jié)構(gòu)改變時,模式-內(nèi)模式的映象也須做相應(yīng)的修改,以使得模式保持不變性。這仍是DBA的責(zé)任。正是由于上述二級映象的功能及其自動實現(xiàn),使得數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)具有較高的邏輯獨(dú)立性和物理獨(dú)立性,從而大大地方便了用戶的使用。
(5)概念模式與模式ANSI研究組于1975年2月提出一個臨時報告。1978年提出一個最終報告,稱之為ANˉSI/SPARC報告,簡稱為SPARC報告。SPARC報告中指出,數(shù)據(jù)庫管理系統(tǒng)應(yīng)具有三級模式的結(jié)構(gòu),即概念模式、外模式和內(nèi)模式。其中外模式和內(nèi)模多與上面所講的大致相當(dāng)。但SPARC報告中的概念模式是指一個組織或部門所對應(yīng)的現(xiàn)實世界的真實模型,即概念模型。概念模式僅描述實體及其屬性和聯(lián)系,不涉及機(jī)器世界的概念。概念模型是信息世界范疇內(nèi)的信息的結(jié)構(gòu),而模式是機(jī)器世界范疇內(nèi)的概念模型的邏輯表示。概念模型獨(dú)立于具體的計算機(jī)系統(tǒng),甚至是和計算機(jī)無關(guān)的,是一個組織或部門的模型。常用的描述概念模式的方法是E-R方法。模式是依賴于具體的計算機(jī)及其DBMS的。模式通過三種具體模型:層次模型、網(wǎng)狀模型和關(guān)系模型來加以實現(xiàn)。概念模式必須轉(zhuǎn)換成具體的數(shù)據(jù)模型,然后才能在相應(yīng)的DBMS上實現(xiàn)。概念模型和模式都是描述信息或數(shù)據(jù)的整體結(jié)構(gòu)的,然而它們是在不同的抽象層次上加以描述的。概念模型離機(jī)器更遠(yuǎn),形式化程度低。從遠(yuǎn)離機(jī)器的觀點(diǎn)看,概念模型更抽象些,但更接近現(xiàn)實世界。而模式描述使用的是形式化的語言-模式DDL,而概念模型描述使用的是E-R圖和一些自然語言。
2.使用數(shù)據(jù)庫的計算機(jī)系統(tǒng)結(jié)構(gòu)
廣義地講,實際上使用數(shù)據(jù)庫的計算機(jī)系統(tǒng)由下列幾個部分組成的:
(1)硬件部分 包括主機(jī)、外部存儲設(shè)備、網(wǎng)絡(luò)設(shè)備和電源等。
(2)軟件部分 包括操作系統(tǒng)、DBMS、編譯系統(tǒng)和應(yīng)用開發(fā)工具軟件等。
(3)人員 包括數(shù)據(jù)庫管理員(Data Base Administrator-DBA),系統(tǒng)分析員(System Anaˉlyst)、應(yīng)用程序員(Application Programmer)和用戶(User)。
3.數(shù)據(jù)庫管理系統(tǒng)
數(shù)據(jù)庫管理系統(tǒng)DBMS是數(shù)據(jù)庫系統(tǒng)的核心。DBMS是負(fù)責(zé)數(shù)據(jù)庫的建立、使用和維護(hù)的軟件。DBMS建立在操作系統(tǒng)之上,實施對數(shù)據(jù)庫的統(tǒng)一管理和控制。用戶使用的各種數(shù)據(jù)庫命令以及應(yīng)用程序的執(zhí)行,最終都必須通過DBMS。另外,DBMS還承擔(dān)著數(shù)據(jù)庫的安全保護(hù)工作,按照DBA所規(guī)定的要求,保證數(shù)據(jù)庫的完整性和安全性。DBMS的主要功能包括以下幾個主要方面:
(1)數(shù)據(jù)庫的定義功能 DBMS通過提供數(shù)據(jù)描述語言(也稱數(shù)據(jù)定義語言)(Data Descripˉtive Language———DDL)來對外模式、模式和內(nèi)模式加以描述。然后模式翻譯程序把用DDL寫的各種模式的定義源碼翻譯成相應(yīng)的內(nèi)部表示,形成相應(yīng)的目標(biāo)形式,分別叫目標(biāo)外模式、目標(biāo)模式、目標(biāo)內(nèi)模式,這些目標(biāo)模式是對數(shù)據(jù)庫的描述,而不是數(shù)據(jù)本身。(目標(biāo))模式只刻畫了數(shù)據(jù)庫的形式或框架,而不包括數(shù)據(jù)庫的內(nèi)容。這些目標(biāo)模式被保存在數(shù)據(jù)字典(或系統(tǒng)目標(biāo))之中,作為DBMS存取和管理數(shù)據(jù)的基本依據(jù)。例如,DBMS根據(jù)這些模式定義,進(jìn)行物理結(jié)構(gòu)和邏輯結(jié)構(gòu)的映象,進(jìn)行邏輯結(jié)構(gòu)和用戶視圖的映象,以導(dǎo)出用戶要檢索的數(shù)據(jù)的存取方式。
(2)數(shù)據(jù)操縱功能 DBMS提供數(shù)據(jù)操縱語言(Data Manipulation Language———DML)實現(xiàn)對數(shù)據(jù)庫中數(shù)據(jù)的一些基本操作,如:檢索、插入、修改、刪除和排序等等。DML有兩類:一類是嵌入主語言的,如嵌入到C或COBOL等高級語言中。這類DML語言本身不能單獨(dú)使用,故此稱為宿主型的DML或嵌入式DML。另一類是非嵌入式語言(包括交互式命令語言和結(jié)構(gòu)化語言),它的語法簡單,可以獨(dú)立使用,由單獨(dú)的解釋或編譯系統(tǒng)來執(zhí)行,所以一般稱為自主型或自含型的DML。命令語言是行結(jié)構(gòu)語言,單條執(zhí)行。結(jié)構(gòu)化語言是命令語言的擴(kuò)充或發(fā)展,增加了程序結(jié)構(gòu)描述或過程控制功能,如循環(huán)、分支等功能。命令語言一般逐條解釋執(zhí)行。結(jié)構(gòu)化語言可以解釋執(zhí)行,也可以編譯執(zhí)行,F(xiàn)在DBMS一般均提供命令語言的交互式環(huán)境和結(jié)構(gòu)環(huán)境兩種運(yùn)行方式,供用戶選擇。DBMS控制和執(zhí)行DML語句(或DML程序),完成對數(shù)據(jù)庫的操作。對于自主型的結(jié)構(gòu)化的DML,DBMS通常采用解釋執(zhí)行的方法,但也有編譯執(zhí)行的方法,而且編譯執(zhí)行的越來越多。另外,很多系統(tǒng)同時設(shè)有解釋和編譯兩種功能,由用戶選其一。對于嵌入型或縮主型DML,DBMS一種提供兩種方法:
①預(yù)編譯方法。
②修改和擴(kuò)充主語言編譯程序(亦稱增強(qiáng)編譯方法)。預(yù)編譯方法是,由DBMS提供一個預(yù)處理程序,對源程序進(jìn)行語法掃描,識別出DML語句,并把這些語句轉(zhuǎn)換成主語言中的特殊調(diào)用語句。主語言必須和DML有調(diào)用接口。這樣在連接形成目標(biāo)時和主語言語句一起形成可執(zhí)行的目標(biāo)。
(3)數(shù)據(jù)庫運(yùn)行管理 數(shù)據(jù)庫運(yùn)行期間的動態(tài)管理是DBMS的核心部分,包括并發(fā)控制、存取控制(或安全性檢查、完整性約束條件的檢查)、數(shù)據(jù)庫內(nèi)部的維護(hù)(如索引、數(shù)據(jù)字典的自動維護(hù)等)、緩沖區(qū)大小的設(shè)置等等。所有的數(shù)據(jù)庫操作都是在這個控制部分的統(tǒng)一管理下,協(xié)同工作,以確保事務(wù)處理的正常運(yùn)行,保證數(shù)據(jù)庫的正確性、安全性和有效性。
(4)數(shù)據(jù)庫的建立和維護(hù)功能 數(shù)據(jù)庫的建立和維護(hù)包括初始數(shù)據(jù)的裝入、數(shù)據(jù)庫的轉(zhuǎn)儲或后備功能、數(shù)據(jù)庫恢復(fù)功能、數(shù)據(jù)庫的重組織功能和性能分析等功能,這些功能一般都由各自對應(yīng)的實用功能子程序來完成。DBMS隨軟件產(chǎn)品和版本不同而有所差異。通常大型機(jī)上的DBMS功能最全,小型機(jī)上的DBMS功能稍弱點(diǎn),微機(jī)上的DBMS更弱些。但是,目前,由于硬件性能和價格的改進(jìn),微機(jī)上的DBMS功能越來越全。
相關(guān)推薦:
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |