盡管軟件發(fā)展中的熱點(diǎn)技術(shù)層出不窮,不斷地變化,有一些東西卻一直未曾改變,其中之一就是開發(fā)人員對數(shù)據(jù)庫的使用和設(shè)計開發(fā)。
你可能會興奮地緊跟時尚創(chuàng)建一個AJAX Web界面,或者使用最近迷人的Windows用戶界面,但是透過這些各種各樣的外觀界面,你可能依然需要從后臺數(shù)據(jù)庫中提取或存取所需要的數(shù)據(jù)——這一點(diǎn)就如同十多年以前人們對數(shù)據(jù)庫的操作是一樣的。
然而,令人吃驚的是,現(xiàn)在還有很多開發(fā)者依然在不斷地重復(fù)著很多年以前就存在的數(shù)據(jù)庫使用和開發(fā)上的錯誤。或許是有太多的開發(fā)者只是來學(xué)習(xí)如何使用一個數(shù)據(jù)庫,而不是真正的去研究它。以下是筆者作為一個開發(fā)者,個人在平時的開發(fā)工作中所精選出的數(shù)據(jù)庫開發(fā)者常犯的十大錯誤,以饗讀者和同行。
1、選擇了錯誤的數(shù)據(jù)庫
不是所有的數(shù)據(jù)庫都可以用來完成你的任務(wù),這意味著當(dāng)你在使用數(shù)據(jù)庫來做任何開發(fā)工作和其他事情前,你必須選擇合適的數(shù)據(jù)庫。例如,我們經(jīng)?吹揭恍〢ccess數(shù)據(jù)庫沒有能力處理的大容量數(shù)據(jù)集,對于SQL Server來說卻像玩小孩子的游戲一樣輕松地完成處理。但是,對于只需要處理幾百行數(shù)據(jù)的需求,有的人卻花錢來購買SQL Server。這些都是錯誤的做法。
廣泛地來說,在當(dāng)今市場中的數(shù)據(jù)庫可以分為三個層次:桌面和嵌入數(shù)據(jù)庫——適合于處理小型任務(wù);一些大型數(shù)據(jù)庫產(chǎn)品的“Express”版也是不錯的,可以處理數(shù)G條數(shù)據(jù);而真正的企業(yè)級數(shù)據(jù)庫,像SQL Server、Oracle和DB2的數(shù)據(jù)處理能力是非常驚人的,你可以毫不猶豫地把數(shù)據(jù)拋給它們。
因此,在你選擇數(shù)據(jù)庫前,你需要對于你的數(shù)據(jù)進(jìn)行一次客觀真實(shí)的分析,從而選擇適合你的開發(fā)工作和實(shí)際需求的數(shù)據(jù)庫產(chǎn)品。
2、選擇了太多的數(shù)據(jù)庫
諸如ODBC、JDBC和OLEDB等應(yīng)用程序編程接口的出現(xiàn),大大促進(jìn)和提升了數(shù)據(jù)庫獨(dú)立性,也就是說,開發(fā)人員可以這樣來編寫你的應(yīng)用程序:你可以讓你的應(yīng)用程序支持使用任何數(shù)據(jù)庫來進(jìn)行數(shù)據(jù)存儲。
然而,這種情況是要付出一些代價的,我曾經(jīng)看到有的開發(fā)團(tuán)隊為了追求應(yīng)用程序的數(shù)據(jù)庫“無關(guān)性”,專門編寫了應(yīng)用程序?qū)⑺械腟QL語句轉(zhuǎn)換成一些底層的語言,以便讓所有的數(shù)據(jù)庫都能理解并執(zhí)行,但是,這樣做的同時也喪失了現(xiàn)有數(shù)據(jù)庫的一些高級功能。
那么為什么這么做呢?可能是出于這樣的考慮:某些客戶在將來的使用中可能想切換到Oracle或DB2或FoxPro,或其他的什么數(shù)據(jù)庫,采用上面的這種做法或許是現(xiàn)在先準(zhǔn)備好了,“未雨綢繆”。
對于此,另一種相反的做法是:當(dāng)你開始開發(fā)一個新產(chǎn)品的時候,選擇一個存儲引擎并開始在此基礎(chǔ)上編寫你的應(yīng)用程序。如果你的產(chǎn)品足夠好,人們會安裝你指定的數(shù)據(jù)庫,因此你不用浪費(fèi)時間和精力來支持一種“假想”的用戶需求。
3、了解你的數(shù)據(jù)
在我們使用數(shù)據(jù)庫的過程中會碰到很多需要考慮的問題,例如有些客戶編號可能并不是我們通常認(rèn)為的七位,而是六位;而有一些公司和企業(yè)出于保護(hù)個人隱私的考慮,可能不一定非要求員工輸入他們的身份證號碼或者銀行帳號,因此這中數(shù)據(jù)類型在數(shù)據(jù)庫搭建和開發(fā)中必須設(shè)置成可以為空(NULL)。
也就是說,數(shù)據(jù)庫開發(fā)和設(shè)計不能脫離實(shí)際情況進(jìn)行,不能遠(yuǎn)離實(shí)際業(yè)務(wù)規(guī)則。對數(shù)據(jù)庫開發(fā)者來說,必須要完全了解用戶真正輸入數(shù)據(jù)的需求是什么,并根據(jù)這些數(shù)據(jù)來合理地設(shè)計數(shù)據(jù)字段的大小、類型以及什么規(guī)則,等等。否則,等待你的將是一次又一次地返回頭來進(jìn)行修改工作。因此,你要學(xué)會在開始的時候就對你需要處理的數(shù)據(jù)具有非常全面、深入的了解,要盡量考慮到各種意外的情況。
4、數(shù)據(jù)庫不像Excel一樣人人會用
現(xiàn)在有一種認(rèn)識上的誤區(qū),尤其是在一些小單位的管理者眼中,他們總認(rèn)為任何開發(fā)者都知道如何去合理地搭建一個數(shù)據(jù)庫。
很明顯,這種誤解讓我很困惑。既然你不會假定任何開發(fā)者都知道如何用C#編程或創(chuàng)建一個Web服務(wù),那么為什么要假定每個開發(fā)者都是數(shù)據(jù)庫專家呢?
這種假設(shè)所帶來的最后結(jié)果是,太多的數(shù)據(jù)庫被一些甚至從來沒有聽說過術(shù)語規(guī)范化(term normalization)的人所設(shè)計。很多數(shù)據(jù)庫的功能根本沒有被合理地運(yùn)用,如果你是這樣一個開發(fā)者的話,那么在你設(shè)計數(shù)據(jù)庫之前,你需要加強(qiáng)這方面的培訓(xùn)和學(xué)習(xí)了。高效的數(shù)據(jù)庫設(shè)計是你必須了解和掌握的技巧,而不要奢望可以通過失敗的教訓(xùn)來了解到這一點(diǎn)。
你可能會興奮地緊跟時尚創(chuàng)建一個AJAX Web界面,或者使用最近迷人的Windows用戶界面,但是透過這些各種各樣的外觀界面,你可能依然需要從后臺數(shù)據(jù)庫中提取或存取所需要的數(shù)據(jù)——這一點(diǎn)就如同十多年以前人們對數(shù)據(jù)庫的操作是一樣的。
然而,令人吃驚的是,現(xiàn)在還有很多開發(fā)者依然在不斷地重復(fù)著很多年以前就存在的數(shù)據(jù)庫使用和開發(fā)上的錯誤。或許是有太多的開發(fā)者只是來學(xué)習(xí)如何使用一個數(shù)據(jù)庫,而不是真正的去研究它。以下是筆者作為一個開發(fā)者,個人在平時的開發(fā)工作中所精選出的數(shù)據(jù)庫開發(fā)者常犯的十大錯誤,以饗讀者和同行。
1、選擇了錯誤的數(shù)據(jù)庫
不是所有的數(shù)據(jù)庫都可以用來完成你的任務(wù),這意味著當(dāng)你在使用數(shù)據(jù)庫來做任何開發(fā)工作和其他事情前,你必須選擇合適的數(shù)據(jù)庫。例如,我們經(jīng)?吹揭恍〢ccess數(shù)據(jù)庫沒有能力處理的大容量數(shù)據(jù)集,對于SQL Server來說卻像玩小孩子的游戲一樣輕松地完成處理。但是,對于只需要處理幾百行數(shù)據(jù)的需求,有的人卻花錢來購買SQL Server。這些都是錯誤的做法。
廣泛地來說,在當(dāng)今市場中的數(shù)據(jù)庫可以分為三個層次:桌面和嵌入數(shù)據(jù)庫——適合于處理小型任務(wù);一些大型數(shù)據(jù)庫產(chǎn)品的“Express”版也是不錯的,可以處理數(shù)G條數(shù)據(jù);而真正的企業(yè)級數(shù)據(jù)庫,像SQL Server、Oracle和DB2的數(shù)據(jù)處理能力是非常驚人的,你可以毫不猶豫地把數(shù)據(jù)拋給它們。
因此,在你選擇數(shù)據(jù)庫前,你需要對于你的數(shù)據(jù)進(jìn)行一次客觀真實(shí)的分析,從而選擇適合你的開發(fā)工作和實(shí)際需求的數(shù)據(jù)庫產(chǎn)品。
2、選擇了太多的數(shù)據(jù)庫
諸如ODBC、JDBC和OLEDB等應(yīng)用程序編程接口的出現(xiàn),大大促進(jìn)和提升了數(shù)據(jù)庫獨(dú)立性,也就是說,開發(fā)人員可以這樣來編寫你的應(yīng)用程序:你可以讓你的應(yīng)用程序支持使用任何數(shù)據(jù)庫來進(jìn)行數(shù)據(jù)存儲。
然而,這種情況是要付出一些代價的,我曾經(jīng)看到有的開發(fā)團(tuán)隊為了追求應(yīng)用程序的數(shù)據(jù)庫“無關(guān)性”,專門編寫了應(yīng)用程序?qū)⑺械腟QL語句轉(zhuǎn)換成一些底層的語言,以便讓所有的數(shù)據(jù)庫都能理解并執(zhí)行,但是,這樣做的同時也喪失了現(xiàn)有數(shù)據(jù)庫的一些高級功能。
那么為什么這么做呢?可能是出于這樣的考慮:某些客戶在將來的使用中可能想切換到Oracle或DB2或FoxPro,或其他的什么數(shù)據(jù)庫,采用上面的這種做法或許是現(xiàn)在先準(zhǔn)備好了,“未雨綢繆”。
對于此,另一種相反的做法是:當(dāng)你開始開發(fā)一個新產(chǎn)品的時候,選擇一個存儲引擎并開始在此基礎(chǔ)上編寫你的應(yīng)用程序。如果你的產(chǎn)品足夠好,人們會安裝你指定的數(shù)據(jù)庫,因此你不用浪費(fèi)時間和精力來支持一種“假想”的用戶需求。
3、了解你的數(shù)據(jù)
在我們使用數(shù)據(jù)庫的過程中會碰到很多需要考慮的問題,例如有些客戶編號可能并不是我們通常認(rèn)為的七位,而是六位;而有一些公司和企業(yè)出于保護(hù)個人隱私的考慮,可能不一定非要求員工輸入他們的身份證號碼或者銀行帳號,因此這中數(shù)據(jù)類型在數(shù)據(jù)庫搭建和開發(fā)中必須設(shè)置成可以為空(NULL)。
也就是說,數(shù)據(jù)庫開發(fā)和設(shè)計不能脫離實(shí)際情況進(jìn)行,不能遠(yuǎn)離實(shí)際業(yè)務(wù)規(guī)則。對數(shù)據(jù)庫開發(fā)者來說,必須要完全了解用戶真正輸入數(shù)據(jù)的需求是什么,并根據(jù)這些數(shù)據(jù)來合理地設(shè)計數(shù)據(jù)字段的大小、類型以及什么規(guī)則,等等。否則,等待你的將是一次又一次地返回頭來進(jìn)行修改工作。因此,你要學(xué)會在開始的時候就對你需要處理的數(shù)據(jù)具有非常全面、深入的了解,要盡量考慮到各種意外的情況。
4、數(shù)據(jù)庫不像Excel一樣人人會用
現(xiàn)在有一種認(rèn)識上的誤區(qū),尤其是在一些小單位的管理者眼中,他們總認(rèn)為任何開發(fā)者都知道如何去合理地搭建一個數(shù)據(jù)庫。
很明顯,這種誤解讓我很困惑。既然你不會假定任何開發(fā)者都知道如何用C#編程或創(chuàng)建一個Web服務(wù),那么為什么要假定每個開發(fā)者都是數(shù)據(jù)庫專家呢?
這種假設(shè)所帶來的最后結(jié)果是,太多的數(shù)據(jù)庫被一些甚至從來沒有聽說過術(shù)語規(guī)范化(term normalization)的人所設(shè)計。很多數(shù)據(jù)庫的功能根本沒有被合理地運(yùn)用,如果你是這樣一個開發(fā)者的話,那么在你設(shè)計數(shù)據(jù)庫之前,你需要加強(qiáng)這方面的培訓(xùn)和學(xué)習(xí)了。高效的數(shù)據(jù)庫設(shè)計是你必須了解和掌握的技巧,而不要奢望可以通過失敗的教訓(xùn)來了解到這一點(diǎn)。