對于一個以數據為中心的應用,數據庫的好壞直接影響到程序的性能,因此數據庫性能至關重要。一般來說,要保證數據庫的效率,要做好以下四個方面的工作:數據庫設計、sql語句優化、數據庫參數配置、恰當的硬件資源和操作系統,這個順序也表現了這四個工作對性能影響的大小。下面我們逐個闡明:
一、數據庫設計
適度的反范式,注意是適度的
我們都知道三范式,基于三范式建立的模型是最有效保存數 據的方式,也是最容易擴展的模式。我們在開發應用程序時,設計的數據庫要最大程度的遵守三范式,特別是對于OLTP型的系統,三范式是必須遵守的規則。當 然,三范式最大的問題在于查詢時通常需要join很多表,導致查詢效率很低。所以有時候基于性能考慮,我們需要有意的違反三范式,適度的做冗余,以達到提 高查詢效率的目的。注意這里的反范式是適度的,必須為這種做法提供充分的理由。下面就是一個糟糕的實例:
在這里,為了提高學生活動記錄的檢索效率,把單位名稱冗余到學生活動記錄表里。單位信息有500條記錄,而學生活動記錄在一年內大概有200萬數據量。 如果學生活動記錄表不冗余這個單位名稱字段,只包含三個int字段和一個timestamp字段,只占用了16字節,是一個很小的表。而冗余了一個 varchar(32)的字段后則是原來的3倍,檢索起來相應也多了這么多的I/O。而且記錄數相差懸殊,500 VS 2000000 ,導致更新一個單位名稱還要更新4000條冗余記錄。由此可見,這個冗余根本就是適得其反。
下面這個冗余就很好
可以看到,[學生考試總分]是冗余的,這個分數完全可以通過[得分情況]匯總得到。在【學生考試總分】里,一次考試一個學生只有一條記錄,而在【得分情 況】里,一個學生針對試卷里一個小題的一個小問一條記錄,粗略的算一下比例大概是1:100。而且判卷子得分是不會輕易變的,更新的頻率不高,所以說這個 冗余是比較好的。