二、數(shù)據(jù)庫(kù)設(shè)計(jì)技巧
1. 設(shè)計(jì)數(shù)據(jù)庫(kù)之前(需求分析階段)
1) 理解客戶需求,包括用戶未來需求變化。
2) 了解企業(yè)業(yè)務(wù)類型,可以在開發(fā)階段節(jié)約大量的時(shí)間。
3) 重視輸入(要記錄的數(shù)據(jù))、輸出(報(bào)表、查詢、視圖)。
4) 創(chuàng)建數(shù)據(jù)字典和ER 圖表
數(shù)據(jù)字典(Data Dictionary,簡(jiǎn)稱DD)是各類數(shù)據(jù)描述的集合,是關(guān)于數(shù)據(jù)庫(kù)中數(shù)據(jù)的描述,即元數(shù)據(jù),不是數(shù)據(jù)本身。(至少應(yīng)該包含每個(gè)字段的數(shù)據(jù)類型和在每個(gè)表內(nèi)的主外鍵)。
數(shù)據(jù)項(xiàng)描述: 數(shù)據(jù)項(xiàng)名,數(shù)據(jù)項(xiàng)含義說明,別名,數(shù)據(jù)類型,長(zhǎng)度,取值范圍,取值含義,與其他數(shù)據(jù)項(xiàng)的邏輯關(guān)系
數(shù)據(jù)結(jié)構(gòu)描述: 數(shù)據(jù)結(jié)構(gòu)名,含義說明,組成:[數(shù)據(jù)項(xiàng)或數(shù)據(jù)結(jié)構(gòu)]
數(shù)據(jù)流描述: 數(shù)據(jù)流名,說明,數(shù)據(jù)流來源,數(shù)據(jù)流去向, 組成:[數(shù)據(jù)結(jié)構(gòu)],平均流量,高峰期流量
數(shù)據(jù)存儲(chǔ)描述: 數(shù)據(jù)存儲(chǔ)名,說明,編號(hào),流入的數(shù)據(jù)流,流出的數(shù)據(jù)流,組成:[數(shù)據(jù)結(jié)構(gòu)],數(shù)據(jù)量,存取方式
處理過程描述: 處理過程名,說明,輸入:[數(shù)據(jù)流],輸出:[數(shù)據(jù)流],處理:[簡(jiǎn)要說明]
ER 圖表和數(shù)據(jù)字典可以讓任何了解數(shù)據(jù)庫(kù)的人都明確如何從數(shù)據(jù)庫(kù)中獲得數(shù)據(jù)。ER圖對(duì)表明表之間關(guān)系很有用,而數(shù)據(jù)字典則說明了每個(gè)字段的用途以及任何可能存在的別名。對(duì)SQL 表達(dá)式的文檔化來說這是完全必要的。
5) 定義標(biāo)準(zhǔn)的對(duì)象命名規(guī)范
數(shù)據(jù)庫(kù)各種對(duì)象的命名必須規(guī)范。
2. 表和字段的設(shè)計(jì)(數(shù)據(jù)庫(kù)邏輯設(shè)計(jì))
表設(shè)計(jì)原則
1) 標(biāo)準(zhǔn)化和規(guī)范化
數(shù)據(jù)的標(biāo)準(zhǔn)化有助于消除數(shù)據(jù)庫(kù)中的數(shù)據(jù)冗余。標(biāo)準(zhǔn)化有好幾種形式,但Third Normal Form(3NF)通常被認(rèn)為在性能、擴(kuò)展性和數(shù)據(jù)完整性方面達(dá)到了最好平衡。簡(jiǎn)單來說,遵守3NF 標(biāo)準(zhǔn)的數(shù)據(jù)庫(kù)的表設(shè)計(jì)原則是:“One Fact in One Place”即某個(gè)表只包括其本身基本的屬性,當(dāng)不是它們本身所具有的屬性時(shí)需進(jìn)行分解。表之間的關(guān)系通過外鍵相連接。它具有以下特點(diǎn):有一組表專門存放通過鍵連接起來的關(guān)聯(lián)數(shù)據(jù)。
2) 數(shù)據(jù)驅(qū)動(dòng)
采用數(shù)據(jù)驅(qū)動(dòng)而非硬編碼的方式,許多策略變更和維護(hù)都會(huì)方便得多,大大增強(qiáng)系統(tǒng)的靈活性和擴(kuò)展性。
舉例,假如用戶界面要訪問外部數(shù)據(jù)源(文件、XML 文檔、其他數(shù)據(jù)庫(kù)等),不妨把相應(yīng)的連接和路徑信息存儲(chǔ)在用戶界面支持的表里。如果用戶界面執(zhí)行工作流之類的任務(wù)(發(fā)送郵件、打印信箋、修改記錄狀態(tài)等),那么產(chǎn)生工作流的數(shù)據(jù)也可以存放在數(shù)據(jù)庫(kù)里。角色權(quán)限管理也可以通過數(shù)據(jù)驅(qū)動(dòng)來完成。事實(shí)上,如果過程是數(shù)據(jù)驅(qū)動(dòng)的,你就可以把相當(dāng)大的責(zé)任推給用戶,由用戶來維護(hù)自己的工作流過程。
3) 考慮各種變化
在設(shè)計(jì)數(shù)據(jù)庫(kù)的時(shí)候考慮到哪些數(shù)據(jù)字段將來可能會(huì)發(fā)生變更。
4) 表名、報(bào)表名和查詢名的命名規(guī)范
(采用前綴命名)檢查表名、報(bào)表名和查詢名之間的命名規(guī)范。你可能會(huì)很快就被這些不同的數(shù)據(jù)庫(kù)要素的名稱搞糊涂了。你可以統(tǒng)一地命名這些數(shù)據(jù)庫(kù)的不同組成部分,至少你應(yīng)該在這些對(duì)象名字的開頭用 Table、Query 或者 Report 等前綴加以區(qū)別。如果采用了 Microsoft Access,你可以用 qry、rpt、tbl 和 mod 等符號(hào)來標(biāo)識(shí)對(duì)象(比如 tbl_Employees)。用 sp_company 標(biāo)識(shí)存儲(chǔ)過程,用 udf_ (或者類似的標(biāo)記)標(biāo)識(shí)自定義編寫的函數(shù)。
字段設(shè)計(jì)原則:
1) 每個(gè)表中都應(yīng)該添加的3 個(gè)有用的字段。
dRecordCreationDate,在SQL Server 下默認(rèn)為GETDATE()
sRecordCreator,在SQL Server 下默認(rèn)為NOT NULL DEFAULT USER
nRecordVersion,記錄的版本標(biāo)記;有助于準(zhǔn)確說明記錄中出現(xiàn)null 數(shù)據(jù)或者丟失數(shù)據(jù)的原因
時(shí)效性數(shù)據(jù)應(yīng)包括“最近更新日期/時(shí)間”字段。時(shí)間標(biāo)記對(duì)查找數(shù)據(jù)問題的原因、按日期重新處理/重載數(shù)據(jù)和清除舊數(shù)據(jù)特別有用。
2) 對(duì)地址和電話采用多個(gè)字段
描述街道地址就短短一行記錄是不夠的。Address_Line1、Address_Line2 和Address_Line3 可以提供更大的靈活性。還有,電話號(hào)碼和郵件地址最好擁有自己的數(shù)據(jù)表,其間具有自身的類型和標(biāo)記類別。
3) 表內(nèi)的列[字段]的命名規(guī)則(采用前綴/后綴命名)、采用有意義的字段名
對(duì)列[字段]名應(yīng)該采用標(biāo)準(zhǔn)的前綴和后綴。如鍵是數(shù)字類型:用 _N 后綴;字符類型:_C 后綴;日期類型:_D 后綴。再如,假如你的表里有好多“money”字段,你不妨給每個(gè)列[字段]增加一個(gè) _M 后綴。
假設(shè)有兩個(gè)表:
Customer 和 Order。Customer 表的前綴是 cu_,所以該表內(nèi)的子段名如下:cu_name_id、cu_surname、cu_initials 和cu_address 等。Order 表的前綴是 or_,所以子段名是:
or_order_id、or_cust_name_id、or_quantity 和 or_description 等。
這樣從數(shù)據(jù)庫(kù)中選出全部數(shù)據(jù)的 SQL 語(yǔ)句可以寫成如下所示:
Select * From Customer, Order Where cu_surname = "MYNAME" ; and cu_name_id = or_cust_name_id and or_quantity = 1 |
在沒有這些前綴的情況下則寫成這個(gè)樣子(用別名來區(qū)分):
Select * From Customer, Order Where Customer.surname = "MYNAME" ; and Customer.name_id = Order.cust_name_id and Order.quantity = 1 |
第 1 個(gè) SQL 語(yǔ)句沒少鍵入多少字符。但如果查詢涉及到 5 個(gè)表乃至更多的列[字段]你就知道這個(gè)技巧多有用了。
5) 選擇數(shù)字類型和文本類型的長(zhǎng)度應(yīng)盡量充足
假設(shè)客戶ID 為10 位數(shù)長(zhǎng)。那你應(yīng)該把數(shù)據(jù)庫(kù)表字段的長(zhǎng)度設(shè)為12 或者13 個(gè)字符長(zhǎng)。但這額外占據(jù)的空間卻無需將來重構(gòu)整個(gè)數(shù)據(jù)庫(kù)就可以實(shí)現(xiàn)數(shù)據(jù)庫(kù)規(guī)模的增長(zhǎng)了。
6) 增加刪除標(biāo)記字段
在表中包含一個(gè)“刪除標(biāo)記”字段,這樣就可以把行標(biāo)記為刪除。在關(guān)系數(shù)據(jù)庫(kù)里不要單獨(dú)刪除某一行;最好采用清除數(shù)據(jù)程序而且要仔細(xì)維護(hù)索引整體性。
7) 提防大小寫混用的對(duì)象名和特殊字符
采用全部大寫而且包含下劃符的名字具有更好的可讀性(CUSTOMER_DATA),絕對(duì)不要在對(duì)象名的字符之間留空格。
8) 小心保留詞
要保證你的字段名沒有和保留詞、數(shù)據(jù)庫(kù)系統(tǒng)或者常用訪問方法沖突,比如,用 DESC 作為說明字段名。后果可想而知!DESC 是 DESCENDING 縮寫后的保留詞。表里的一個(gè) SELECT * 語(yǔ)句倒是能用,但得到的卻是一大堆毫無用處的信息。
9) 保持字段名和類型的一致性
在命名字段并為其指定數(shù)據(jù)類型的時(shí)候一定要保證一致性。假如字段在表1中叫做“agreement_number”,就別在表2里把名字改成 “ref1”。假如數(shù)據(jù)類型在表1里是整數(shù),那在表2里可就別變成字符型了。當(dāng)然在表1(ABC)有處鍵ID,則為了可讀性,在表2做關(guān)聯(lián)時(shí)可以命名為 ABC_ID。
10) 避免使用觸發(fā)器
觸發(fā)器的功能通??梢杂闷渌绞綄?shí)現(xiàn)。在調(diào)試程序時(shí)觸發(fā)器可能成為干擾。假如你確實(shí)需要采用觸發(fā)器,你最好集中對(duì)它文檔化。
3. 選擇鍵和索引(數(shù)據(jù)庫(kù)邏輯設(shè)計(jì))
參考:《SQL優(yōu)化-索引》一文
4. 數(shù)據(jù)完整性設(shè)計(jì)(數(shù)據(jù)庫(kù)邏輯設(shè)計(jì))
1) 完整性實(shí)現(xiàn)機(jī)制:
實(shí)體完整性:主鍵
參照完整性:
父表中刪除數(shù)據(jù):級(jí)聯(lián)刪除;受限刪除;置空值
父表中插入數(shù)據(jù):受限插入;遞歸插入
父表中更新數(shù)據(jù):級(jí)聯(lián)更新;受限更新;置空值
DBMS對(duì)參照完整性可以有兩種方法實(shí)現(xiàn):外鍵實(shí)現(xiàn)機(jī)制(約束規(guī)則)和觸發(fā)器實(shí)現(xiàn)機(jī)制用戶定義完整性:
NOT NULL;CHECK;觸發(fā)器
2) 用約束而非商務(wù)規(guī)則強(qiáng)制數(shù)據(jù)完整性
采用數(shù)據(jù)庫(kù)系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)的完整性。這不但包括通過標(biāo)準(zhǔn)化實(shí)現(xiàn)的完整性而且還包括數(shù)據(jù)的功能性。不要依賴于商務(wù)層保證數(shù)據(jù)完整性;它不能保證表之間(外鍵)的完整性所以不能強(qiáng)加于其他完整性規(guī)則之上。如果你在數(shù)據(jù)層確實(shí)采用了約束,你要保證有辦法把更新不能通過約束檢查的原因采用用戶理解的語(yǔ)言通知用戶界面。
3) 強(qiáng)制指示完整性
在有害數(shù)據(jù)進(jìn)入數(shù)據(jù)庫(kù)之前將其剔除。激活數(shù)據(jù)庫(kù)系統(tǒng)的指示完整性特性。這樣可以保持?jǐn)?shù)據(jù)的清潔而能迫使開發(fā)人員投入更多的時(shí)間處理錯(cuò)誤條件。
4) 使用查找控制數(shù)據(jù)完整性
控制數(shù)據(jù)完整性的最佳方式就是限制用戶的選擇。只要有可能都應(yīng)該提供給用戶一個(gè)清晰的價(jià)值列表供其選擇。這樣將減少鍵入代碼的錯(cuò)誤和誤解同時(shí)提供數(shù)據(jù)的一致性。某些公共數(shù)據(jù)特別適合查找:國(guó)家代碼、狀態(tài)代碼等。
5) 采用視圖
為了在數(shù)據(jù)庫(kù)和應(yīng)用程序代碼之間提供另一層抽象,可以為應(yīng)用程序建立專門的視圖而不必非要應(yīng)用程序直接訪問數(shù)據(jù)表。這樣做還等于在處理數(shù)據(jù)庫(kù)變更時(shí)給你提供了更多的自由。
6) 分布式數(shù)據(jù)系統(tǒng)
對(duì)分布式系統(tǒng)而言,在你決定是否在各個(gè)站點(diǎn)復(fù)制所有數(shù)據(jù)還是把數(shù)據(jù)保存在一個(gè)地方之前應(yīng)該估計(jì)一下未來 5 年或者 10 年的數(shù)據(jù)量。當(dāng)你把數(shù)據(jù)傳送到其他站點(diǎn)的時(shí)候,最好在數(shù)據(jù)庫(kù)字段中設(shè)置一些標(biāo)記,在目的站點(diǎn)收到你的數(shù)據(jù)之后更新你的標(biāo)記。為了進(jìn)行這種數(shù)據(jù)傳輸,請(qǐng)寫下你自己的批處理或者調(diào)度程序以特定時(shí)間間隔運(yùn)行而不要讓用戶在每天的工作后傳輸數(shù)據(jù)。本地拷貝你的維護(hù)數(shù)據(jù),比如計(jì)算常數(shù)和利息率等,設(shè)置版本號(hào)保證數(shù)據(jù)在每個(gè)站點(diǎn)都完全一致。
7) 關(guān)系
如果兩個(gè)實(shí)體之間存在多對(duì)一關(guān)系,而且還有可能轉(zhuǎn)化為多對(duì)多關(guān)系,那么你最好一開始就設(shè)置成多對(duì)多關(guān)系。從現(xiàn)有的多對(duì)一關(guān)系轉(zhuǎn)變?yōu)槎鄬?duì)多關(guān)系比一開始就是多對(duì)多關(guān)系要難得多。
8) 給數(shù)據(jù)保有和恢復(fù)制定計(jì)劃
考慮數(shù)據(jù)保存策略并包含在設(shè)計(jì)過程中,預(yù)先設(shè)計(jì)你的數(shù)據(jù)恢復(fù)過程。采用可以發(fā)布給用戶/開發(fā)人員的數(shù)據(jù)字典實(shí)現(xiàn)方便的數(shù)據(jù)識(shí)別同時(shí)保證對(duì)數(shù)據(jù)源文檔化。編寫在線更新來“更新查詢”供以后萬一數(shù)據(jù)丟失可以重新處理更新。
9) 用存儲(chǔ)過程讓系統(tǒng)做重活
提供一整套常規(guī)的存儲(chǔ)過程來訪問各組以便加快速度和簡(jiǎn)化客戶程序代碼的開發(fā)。數(shù)據(jù)庫(kù)不只是一個(gè)存放數(shù)據(jù)的地方,它也是簡(jiǎn)化編碼之地。
5. 其他設(shè)計(jì)技巧
1) 避免使用觸發(fā)器
觸發(fā)器的功能通??梢杂闷渌绞綄?shí)現(xiàn)。在調(diào)試程序時(shí)觸發(fā)器可能成為干擾。假如你確實(shí)需要采用觸發(fā)器,你最好集中對(duì)它文檔化。
2) 使用常用英語(yǔ)(或者其他任何語(yǔ)言)而不要使用編碼
在創(chuàng)建下拉菜單、列表、報(bào)表時(shí)最好按照英語(yǔ)名排序。假如需要編碼,可以在編碼旁附上用戶知道的英語(yǔ)。
3) 保存常用信息
讓一個(gè)表專門存放一般數(shù)據(jù)庫(kù)信息非常有用。在這個(gè)表里存放數(shù)據(jù)庫(kù)當(dāng)前版本、最近檢查/修復(fù)(對(duì)Access)、關(guān)聯(lián)設(shè)計(jì)文檔的名稱、客戶等信息。這樣可以實(shí)現(xiàn)一種簡(jiǎn)單機(jī)制跟蹤數(shù)據(jù)庫(kù),當(dāng)客戶抱怨他們的數(shù)據(jù)庫(kù)沒有達(dá)到希望的要求而與你聯(lián)系時(shí),這樣做對(duì)非客戶機(jī)/服務(wù)器環(huán)境特別有用。
4) 包含版本機(jī)制
在數(shù)據(jù)庫(kù)中引入版本控制機(jī)制來確定使用中的數(shù)據(jù)庫(kù)的版本。時(shí)間一長(zhǎng),用戶的需求總是會(huì)改變的。最終可能會(huì)要求修改數(shù)據(jù)庫(kù)結(jié)構(gòu)。把版本信息直接存放到數(shù)據(jù)庫(kù)中更為方便。
5) 編制文檔
對(duì)所有的快捷方式、命名規(guī)范、限制和函數(shù)都要編制文檔。
采用給表、列、觸發(fā)器等加注釋的 數(shù)據(jù)庫(kù)工具。對(duì)開發(fā)、支持和跟蹤修改非常有用。
對(duì)數(shù)據(jù)庫(kù)文檔化,或者在數(shù)據(jù)庫(kù)自身的內(nèi)部或者單獨(dú)建立文檔。這樣,當(dāng)過了一年多時(shí)間后再回過頭來做第2 個(gè)版本,犯錯(cuò)的機(jī)會(huì)將大大減少。
6) 測(cè)試、測(cè)試、反復(fù)測(cè)試
建立或者修訂數(shù)據(jù)庫(kù)之后,必須用用戶新輸入的數(shù)據(jù)測(cè)試數(shù)據(jù)字段。最重要的是,讓用戶進(jìn)行測(cè)試并且同用戶一道保證選擇的數(shù)據(jù)類型滿足商業(yè)要求。測(cè)試需要在把新數(shù)據(jù)庫(kù)投入實(shí)際服務(wù)之前完成。
7) 檢查設(shè)計(jì)
在開發(fā)期間檢查數(shù)據(jù)庫(kù)設(shè)計(jì)的常用技術(shù)是通過其所支持的應(yīng)用程序原型檢查數(shù)據(jù)庫(kù)。換句話說,針對(duì)每一種最終表達(dá)數(shù)據(jù)的原型應(yīng)用,保證你檢查了數(shù)據(jù)模型并且查看如何取出數(shù)據(jù)。
![]() | 作者:不懂.NET |
出處:http://mqsuper.cnblogs.com | |
本文版權(quán)所有,歡迎轉(zhuǎn)載,但未經(jīng)作者同意必須保留此段聲明,且在文章頁(yè)面明顯位置給出原文連接,否則保留追究法律責(zé)任的權(quán)利。 |
聯(lián)系客服