Labs 導(dǎo)讀
數(shù)據(jù)庫設(shè)計是數(shù)據(jù)庫系統(tǒng)中的重要組成部分。一個良好的數(shù)據(jù)庫可以給系統(tǒng)帶來清晰的數(shù)據(jù)統(tǒng)計與數(shù)據(jù)的詳細分析,同時給后續(xù)的開發(fā)、拓展和維護帶來極大的便捷。本文通過列舉出當(dāng)下互聯(lián)網(wǎng)領(lǐng)域常見的數(shù)據(jù)庫架構(gòu)方案,結(jié)合數(shù)據(jù)庫架構(gòu)的設(shè)計原則,對各個方案場景初步淺析,幫助大家知曉各方案優(yōu)劣及適用場景;并結(jié)合實踐經(jīng)驗,給出各個方案后續(xù)典型的演化方向,供大家作為今后數(shù)據(jù)庫架構(gòu)選型參照。
作者:薛建正
單位:中國移動智慧家庭運營中心智慧互聯(lián)產(chǎn)品部
Part 01 ●數(shù)據(jù)庫架構(gòu)原則●
高可用
高可用指的是數(shù)據(jù)庫應(yīng)盡可能地使其服務(wù)持續(xù)可用,以消除或最小化停機時間。這可以通過減少單點故障、故障切換解決方案、數(shù)據(jù)冗余等方式實現(xiàn)。
高性能
這指的是數(shù)據(jù)庫在查詢和數(shù)據(jù)操作上的處理速度。高性能數(shù)據(jù)庫系統(tǒng)能迅速響應(yīng)查詢請求,甚至在處理大量數(shù)據(jù)時也能保持高性能。這在互聯(lián)網(wǎng)場景下尤為重要,因為用戶通常期望快速響應(yīng)。
一致性
在數(shù)據(jù)庫領(lǐng)域,一致性指的是在任何給定時間點,所有的復(fù)制數(shù)據(jù)都必須相同。數(shù)據(jù)庫系統(tǒng)采取多種策略來保證一致性,比如操作的原子性(一個操作要么全部成功,要么全部失敗,不會出現(xiàn)部分完成的情況)和事務(wù)的隔離性(通過鎖和其他并發(fā)控制機制來防止多個事務(wù)交叉執(zhí)行產(chǎn)生的數(shù)據(jù)不一致問題)。
擴展性
擴展性指的是數(shù)據(jù)庫在增加硬件資源(如存儲和處理能力)時能有效提升性能的能力。水平擴展(增加更多服務(wù)器)和垂直擴展(增強單個服務(wù)器能力)是兩種常見的擴展策略。一個具有高擴展性的數(shù)據(jù)庫能夠應(yīng)對數(shù)據(jù)增長和查詢量的增長,保證數(shù)據(jù)庫系統(tǒng)的性能和穩(wěn)定性。
Part 02 ●常見的架構(gòu)方案●
方案一:主備架構(gòu),只有主庫提供讀寫服務(wù),備庫冗余作故障轉(zhuǎn)移用

jdbc//vip:3306/xxdb
1、高可用分析:高可用,主庫掛了,keepalive(只是一種工具)會自動切換到備庫。這個過程對業(yè)務(wù)層是透明的,無需修改代碼或配置。
2、高性能分析:讀寫都操作主庫,很容易產(chǎn)生瓶頸。大部分互聯(lián)網(wǎng)應(yīng)用讀多寫少,讀會先成為瓶頸,進而影響寫性能。另外,備庫只是單純的備份,資源利用率50%,這點方案二可解決。
3、一致性分析:讀寫都操作主庫,不存在數(shù)據(jù)一致性問題。
4、擴展性分析:無法通過加從庫來擴展讀性能,進而提高整體性能。
5、可落地分析:兩點影響落地使用。第一,性能一般,這點可以通過建立高效的索引和引入緩存來增加讀性能,進而提高性能。這也是通用的方案。第二,擴展性差,這點可以通過分庫分表來擴展。
方案二:雙主架構(gòu),兩個主庫同時提供服務(wù),負載均衡

jdbc//vip:3306/xxdb
1、高可用分析:高可用,一個主庫掛了,不影響另一臺主庫提供服務(wù)。這個過程對業(yè)務(wù)層是透明的,無需修改代碼或配置。
2、高性能分析:讀寫性能相比于方案一都得到提升,提升一倍。
3、一致性分析:存在數(shù)據(jù)一致性問題。一致性解決方案。
4、擴展性分析:當(dāng)然可以擴展成三主循環(huán),但筆者不建議(會多一層數(shù)據(jù)同步,這樣同步的時間會更長)。如果非得在數(shù)據(jù)庫架構(gòu)層面擴展的話,擴展為方案四。
5、可落地分析:兩點影響落地使用。第一,數(shù)據(jù)一致性問題,一致性解決方案可解決問題。第二,主鍵沖突問題,ID統(tǒng)一地由分布式ID生成服務(wù)來生成可解決問題。
方案三:主從架構(gòu),一主多從,讀寫分離

jdbc//master-ip:3306/xxdb jdbc//slave1-ip:3306/xxdb jdbc//slave2-ip:3306/xxdb
1、高可用分析:主庫單點,從庫高可用。一旦主庫掛了,寫服務(wù)也就無法提供。
2、高性能分析:大部分互聯(lián)網(wǎng)應(yīng)用讀多寫少,讀會先成為瓶頸,進而影響整體性能。讀的性能提高了,整體性能也提高了。另外,主庫可以不用索引,線上從庫和線下從庫也可以建立不同的索引(線上從庫如果有多個還是要建立相同的索引,不然得不償失;線下從庫是平時開發(fā)人員排查線上問題時查的庫,可以建更多的索引)。
3、一致性分析:存在數(shù)據(jù)一致性問題。請看,一致性解決方案。
4、擴展性分析:可以通過加從庫來擴展讀性能,進而提高整體性能。(帶來的問題是,從庫越多需要從主庫拉取binlog日志的端就越多,進而影響主庫的性能,并且數(shù)據(jù)同步完成的時間也會更長)
5、可落地分析:兩點影響落地使用。第一,數(shù)據(jù)一致性問題,一致性解決方案可解決問題。第二,主庫單點問題,筆者暫時沒想到很好的解決方案。注:思考一個問題,一臺從庫掛了會怎樣?讀寫分離之讀的負載均衡策略怎么容錯?
方案四:雙主+主從架構(gòu),看似完美的方案

jdbc//vip:3306/xxdb jdbc//slave1-ip:3306/xxdb jdbc//slave2-ip:3306/xxdb
1、高可用分析:高可用。
2、高性能分析:高性能。
3、一致性分析:存在數(shù)據(jù)一致性問題。請看,一致性解決方案。
4、擴展性分析:可以通過加從庫來擴展讀性能,進而提高整體性能。(帶來的問題同方案二)
5、可落地分析:同方案二,但數(shù)據(jù)同步又多了一層,數(shù)據(jù)延遲更嚴(yán)重。
Part 03 ●一致性解決方案●
第一類:主庫和從庫一致性解決方案

注:圖中圈出的是數(shù)據(jù)同步的地方,數(shù)據(jù)同步(從庫從主庫拉取binlog日志,再執(zhí)行一遍)是需要時間的,這個同步時間內(nèi)主庫和從庫的數(shù)據(jù)會存在不一致的情況。如果同步過程中有讀請求,那么讀到的就是從庫中的老數(shù)據(jù)。如下圖:

既然知道了數(shù)據(jù)不一致性產(chǎn)生的原因,有下面幾個解決方案供參考:
1、直接忽略,如果業(yè)務(wù)允許延時存在,那么就不去管它。
2、強制讀主,采用主備架構(gòu)方案,讀寫都走主庫。用緩存來擴展數(shù)據(jù)庫讀性能 。有一點需要知道,如果緩存掛了,可能會產(chǎn)生雪崩現(xiàn)象,不過一般分布式緩存都是高可用的。

3、選擇讀主,寫操作時根據(jù)庫+表+業(yè)務(wù)特征生成一個key放到Cache里并設(shè)置超時時間(大于等于主從數(shù)據(jù)同步時間)。讀請求時,同樣的方式生成key先去查Cache,再判斷是否命中。若命中,則讀主庫,否則讀從庫。代價是多了一次緩存讀寫,基本可以忽略。

4、半同步復(fù)制,等主從同步完成,寫請求才返回。就是大家常說的“半同步復(fù)制”semi-sync。這可以利用數(shù)據(jù)庫原生功能,實現(xiàn)比較簡單。代價是寫請求時延增長,吞吐量降低。
5、數(shù)據(jù)庫中間件,引入開源(mycat等)或自研的數(shù)據(jù)庫中間層。個人理解,思路同選擇讀主。數(shù)據(jù)庫中間件的成本比較高,并且還多引入了一層。

第二類:DB和緩存一致性解決方案

先來看一下常用的緩存使用方式:
第一步:淘汰緩存;
第二步:寫入數(shù)據(jù)庫;
第三步:讀取緩存?返回:讀取數(shù)據(jù)庫;
第四步:讀取數(shù)據(jù)庫后寫入緩存注:如果按照這種方式,圖一,不會產(chǎn)生DB和緩存不一致問題;圖二,會產(chǎn)生DB和緩存不一致問題,即4.read先于3.sync執(zhí)行。如果不做處理,緩存里的數(shù)據(jù)可能一直是臟數(shù)據(jù)。解決方式如下:

注:設(shè)置緩存時,一定要加上有效時間,以防延時淘汰緩存失敗的情況!
Part 04 ●架構(gòu)演變方案●
架構(gòu)演變一:方案一 -> 方案一+分庫分表 -> 方案二+分庫分表 -> 方案四+分庫分表;
架構(gòu)演變二:方案一 -> 方案一+分庫分表 -> 方案三+分庫分表 -> 方案四+分庫分表;
架構(gòu)演變?nèi)?/strong>方案一 -> 方案二 -> 方案四 -> 方案四+分庫分表;
架構(gòu)演變四:方案一 -> 方案三 -> 方案四 -> 方案四+分庫分表;
Part 05 ●結(jié)語●
1、加緩存和索引是通用的提升數(shù)據(jù)庫性能的方式。
2、分庫分表帶來的好處是巨大的,但同樣也會帶來一些問題,詳見前日推文。
3、不管是主備+分庫分表還是主從+讀寫分離+分庫分表,都要考慮具體的業(yè)務(wù)場景。絕大部分的數(shù)據(jù)庫架構(gòu)還是采用方案一和方案一+分庫分表,只有極少部分用方案三+讀寫分離+分庫分表。另外,阿里云提供的數(shù)據(jù)庫云服務(wù)也都是主備方案,要想主從+讀寫分離需要二次架構(gòu)。
4、記住一句話:不考慮業(yè)務(wù)場景的架構(gòu)都是耍流氓。
審核編輯:湯梓紅
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
55文章
11336瀏覽量
109886 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
4019瀏覽量
68335 -
代碼
+關(guān)注
關(guān)注
30文章
4967瀏覽量
73954
原文標(biāo)題:淺析:數(shù)據(jù)庫之互聯(lián)網(wǎng)常用架構(gòu)方案一覽及應(yīng)用場景
文章出處:【微信號:5G通信,微信公眾號:5G通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
聯(lián)想將進軍互聯(lián)網(wǎng)
互聯(lián)網(wǎng)電視迅速崛起
工業(yè)互聯(lián)網(wǎng)
工業(yè)互聯(lián)網(wǎng)
誠征自動化(硬件、嵌入式)、互聯(lián)網(wǎng)、 數(shù)據(jù)庫、數(shù)據(jù)安全技術(shù)合伙人
互聯(lián)網(wǎng)與工業(yè)物聯(lián)網(wǎng)之間的區(qū)別與聯(lián)系
什么是產(chǎn)業(yè)互聯(lián)網(wǎng)?
labview軟件連接云數(shù)據(jù)庫,實現(xiàn)文件管理,版本更新,物聯(lián)網(wǎng)搭建~~~
工業(yè)互聯(lián)網(wǎng)面臨的挑戰(zhàn)
圖模型和圖數(shù)據(jù)庫
在ARM9上用輕型WEB服務(wù)器可以不接入互聯(lián)網(wǎng)嗎
ARM上實現(xiàn)不用接入互聯(lián)網(wǎng)的WEB服務(wù)器可以嗎
基于互聯(lián)網(wǎng)的觸摸屏數(shù)據(jù)庫遠程監(jiān)控系統(tǒng)
數(shù)據(jù)庫有哪些常見的應(yīng)用結(jié)構(gòu)數(shù)據(jù)庫應(yīng)用結(jié)構(gòu)的使用資料概述
工業(yè)互聯(lián)網(wǎng)時代,我們?yōu)槭裁葱枰粋€時序數(shù)據(jù)庫?
互聯(lián)網(wǎng)領(lǐng)域常見的數(shù)據(jù)庫架構(gòu)方案
評論