国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

細說redis十種數據類型及底層原理

程序員cxuan ? 來源:程序員cxuan ? 2023-05-15 11:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

概述

Redis 是一個開源的高性能鍵值數據庫,它支持多種數據類型,可以滿足不同的業務需求。本文將介紹 Redis 的10種數據類型,分別是

  • string(字符串)
  • hash(哈希)
  • list(列表)
  • set(集合)
  • zset(有序集合)
  • stream(流)
  • geospatial(地理)
  • bitmap(位圖)
  • bitfield(位域)
  • hyperloglog(基數統計)

String

概述

string 是 Redis 最基本的數據類型,它可以存儲任意類型的數據,比如文本、數字、圖片或者序列化的對象。一個 string 類型的鍵最大可以存儲 512 MB 的數據。

string 類型的底層實現是 SDS(simple dynamic string),它是一個動態字符串結構,由長度、空閑空間和字節數組三部分組成。SDS有3種編碼類型:

  • embstr:占用64Bytes的空間,存儲44Bytes的數據
  • raw:存儲大于44Bytes的數據
  • int:存儲整數類型

embstr和raw存儲字符串數據,int存儲整型數據

應用場景

string 類型的應用場景非常廣泛,比如:

  • 緩存數據,提高訪問速度和降低數據庫壓力。
  • 計數器,利用 incr 和 decr 命令實現原子性的加減操作。
  • 分布式鎖,利用 setnx 命令實現互斥訪問。
  • 限流,利用 expire 命令實現時間窗口內的訪問控制。

底層原理

embstr結構

embstr 結構存儲小于等于44個字節的字符串,embstr 每次開辟64個byte的空間

  • 前19個byte用于存儲embstr 結構
  • 中間的44個byte存儲數據
  • 最后為符號24413acc-f2cf-11ed-90ce-dac502259ad0.png

raw結構

244f57b0-f2cf-11ed-90ce-dac502259ad0.pngimage

embstr和raw的轉換

在存儲字符串的時候,redis會根據數據的長度判斷使用哪種結構

  • 如果長度小于等于44個字節,就會選擇embstr 結構
  • 如果長度大于44個byte,就會選擇raw結構245a3f9a-f2cf-11ed-90ce-dac502259ad0.png
127.0.0.1:6379>objectencodingstr
"embstr"
#str賦值44個字節的字符串
127.0.0.1:6379>setstr1234567890123456789012345678901234567890abcd
OK
127.0.0.1:6379>objectencodingstr
"embstr"
#str2賦值45個字節的字符串
127.0.0.1:6379>setstr21234567890123456789012345678901234567890abcde
OK
127.0.0.1:6379>objectencodingstr2
"raw"
127.0.0.1:6379>setnum123
OK
127.0.0.1:6379>objectencodingnum
"int"

Hash

概述

hash 是一個鍵值對集合,它可以存儲多個字段和值,類似于編程語言中的 map 對象。一個 hash 類型的鍵最多可以存儲 2^32 - 1 個字段。

Hash類型的底層實現有三種:

  • ziplist:壓縮列表,當hash達到一定的閾值時,會自動轉換為hashtable結構
  • listpack:緊湊列表,在Redis7.0之后,listpack正式取代ziplist。同樣的,當hash達到一定的閾值時,會自動轉換為hashtable結構
  • hashtable:哈希表,類似map

應用場景

hash 類型的應用場景主要是存儲對象,比如:

  • 用戶信息,利用 hset 和 hget 命令實現對象屬性的增刪改查。
  • 購物車,利用 hincrby 命令實現商品數量的增減。
  • 配置信息,利用 hmset 和 hmget 命令實現批量設置和獲取配置項。

底層原理

Redis在存儲hash結構的數據,為了達到內存和性能的平衡,也針對少量存儲和大量存儲分別設計了兩種結構,分別為:

  • ziplist(redis7.0之前使用)和listpack(redis7.0之后使用)
  • hashTable

ziplist/listpack編碼轉換為hashTable編碼是通過判斷元素數量單個元素Key或Value的長度決定的:

  • hash-max-ziplist-entries:表示當hash中的元素數量小于或等于該值時,使用ziplist編碼,否則使用hashtable編碼。ziplist是一種壓縮列表,它可以節省內存空間,但是訪問速度較慢。hashtable是一種哈希表,它可以提高訪問速度,但是占用內存空間較多。默認值為512。
  • hash-max-ziplist-value:表示當 hash中的每個元素的 key value 的長度都小于或等于該值時,使用 ziplist編碼,否則使用 hashtable編碼。默認值為 64。

ziplist與listpack

ziplist/listpack都是hash結構用來存儲少量數據的結構。從Redis7.0后,hash默認使用listpack結構。因為 ziplist有一個致命的缺陷,就是連鎖更新,當一個節點的長度發生變化時,可能會導致后續所有節點的長度字段都要重新編碼,這會造成極差的性能

ziplist結構

ziplist是一種緊湊的鏈表結構,它將所有的字段和值順序地存儲在一塊連續的內存中。24645110-f2cf-11ed-90ce-dac502259ad0.pngRedis中ziplist源碼

typedefstruct{
/*當使用字符串時,slen表示為字符串長度*/
unsignedchar*sval;
unsignedintslen;
/*當使用整形時,sval為NULL,lval為ziplistEntry的value*/
longlonglval;
}ziplistEntry;

listpack結構

2469a728-f2cf-11ed-90ce-dac502259ad0.pngimage

zipList的連鎖更新問題

ziplist的每個entry都包含previous_entry_length來記錄上一個節點的大小,長度是1個或5個byte:

  • 如果前一節點的長度小于254個byte,則采用1個byte來保存這個長度值
  • 如果前一節點的長度大于等于254個byte,則采用5個byte來保存這個長度值,第一個byte為0xfe,后四個byte才是真實長度數據

假設,現有有N個連續、長度為250~253個byte的entry,因此entry的previous_entry_length屬性占用1個btye

246f868e-f2cf-11ed-90ce-dac502259ad0.pngimage

當第一節長度大于等于254個bytes,導致第二節previous_entry_length變為5個bytes,第二節的長度由250變為254。而第二節長度的增加必然會影響第三節的previous_entry_length。ziplist這種特殊套娃的情況下產生的連續多次空間擴展操作成為連鎖更新。新增、刪除都可能導致連鎖更新的產生。

listpack是如何解決的

2469a728-f2cf-11ed-90ce-dac502259ad0.pngimage
  1. 由于ziplist需要倒著遍歷,所以需要用previous_entry_length記錄前一個entry的長度。而listpack可以通過total_bytes和end計算出來。所以previous_entry_length不需要了。
  2. listpack 的設計徹底消滅了 ziplist 存在的級聯更新行為,元素與元素之間完全獨立,不會因為一個元素的長度變長就導致后續的元素內容會受到影響。
  3. 與ziplist做對比的話,犧牲了內存使用率,避免了連鎖更新的情況。從代碼復雜度上看,listpack相對ziplist簡單很多,再把增刪改統一做處理,從listpack的代碼實現上看,極簡且高效。

hashTable

hashTable是一種散列表結構,它將字段和值分別存儲在兩個數組中,并通過哈希函數計算字段在數組中的索引

247edc88-f2cf-11ed-90ce-dac502259ad0.pngimage

Redis中hashTable源碼

structdict{
dictType*type;
dictEntry**ht_table[2];
unsignedlonght_used[2];
longrehashidx;/*當進行rehash時,rehashidx為-1*/
int16_tpauserehash;/*如果rehash暫停,pauserehash則大于0,(小于0表示代碼錯誤)*/
signedcharht_size_exp[2];/*哈希桶的個數(size=1<
};

typedefstructdict{
dictEntry**table;
dictType*type;
unsignedlongsize;
unsignedlongsizemask;
unsignedlongused;
void*privdata;
}dict;

typedefstructdictEntry{
void*key;
void*val;
structdictEntry*next;
}dictEntry;

ziplist和hashTable的轉換

2484ee98-f2cf-11ed-90ce-dac502259ad0.pngimage
127.0.0.1:6379>hseth1id123456789012345678901234567890123456789012345678901234567890abcd
(integer)1
127.0.0.1:6379>objectencodingh1
"ziplist"
127.0.0.1:6379>hseth2id123456789012345678901234567890123456789012345678901234567890abcde
(integer)1
127.0.0.1:6379>objectencodingh2
"hashtable"

ziplist的廢棄

顯然是ziplist在field個數太大、key太長、value太長三者有其一的時候會有以下問題:

  1. ziplist每次插入都有開辟空間,連續的
  2. 查詢的時候,需要從頭開始計算,查詢速度變慢

hashTable變得越來越長怎么辦

擴容,hashTabel是怎么擴容的?使用的是漸進式擴容rehash。rehash會重新計算哈希值,且將哈希桶的容量擴大。

rehash 步驟

24a46264-f2cf-11ed-90ce-dac502259ad0.pngimage

擴展哈希和收縮哈希都是通過執行rehash來完成,這其中就涉及到了空間的分配和釋放,主要經過以下五步:

  1. 為字典dict的ht[1]哈希表分配空間,其大小取決于當前哈希表已保存節點數(即:

    ht[0].used
    

    ):

  • 如果是擴展操作則ht[1]的大小為2的n次方中第一個大于等于ht[0].used * 2屬性的值(比如used=3,此時ht[0].used * 2=6,故2的3次方為8就是第一個大于used * 2的值(2 的 2 次方 6))。
  • 如果是收縮操作則ht[1]大小為 2 的 n 次方中第一個大于等于ht[0].used的值
  • 將字典中的屬性rehashidx的值設置為0,表示正在執行rehash操作

  • 將ht[0]中所有的鍵值對依次重新計算哈希值,并放到ht[1]數組對應位置,每完成一個鍵值對的rehash之后rehashidx的值需要自增1

  • 當ht[0]中所有的鍵值對都遷移到ht[1]之后,釋放ht[0],并將ht[1]修改為ht[0],然后再創建一個新的ht[1]數組,為下一次rehash做準備

  • 將字典中的屬性rehashidx設置為-1,表示此次rehash操作結束,等待下一次rehash

漸進式 rehash

Redis中的這種重新哈希的操作因為不是一次性全部rehash,而是分多次來慢慢的將ht[0]中的鍵值對rehash到ht[1],故而這種操作也稱之為漸進式rehash。漸進式rehash可以避免集中式rehash帶來的龐大計算量,是一種分而治之的思想。

在漸進式rehash過程中,因為還可能會有新的鍵值對存進來,此時Redis的做法是新添加的鍵值對統一放入ht[1]中,這樣就確保了ht[0]鍵值對的數量只會減少。

當正在執行rehash操作時,如果服務器收到來自客戶端的命令請求操作,則會先查詢ht[0],查找不到結果再到ht[1]中查詢

List

概述

list 是一個有序的字符串列表,它按照插入順序排序,并且支持在兩端插入或刪除元素。一個 list 類型的鍵最多可以存儲 2^32 - 1 個元素。

redis3.2以后,list 類型的底層實現只有一種結構,就是quicklist。版本不同時,底層實現是不同的,下面會講解。

應用場景

list 類型的應用場景主要是實現隊列和棧,比如:

  • 消息隊列,利用 lpush 和 rpop 命令實現生產者消費者模式。
  • 最新消息,利用 lpush 和 ltrim 命令實現固定長度的時間線。
  • 歷史記錄,利用 lpush 和 lrange 命令實現瀏覽記錄或者搜索記錄。

底層原理

在講解list結構之前,需要先說明一下list結構編碼的更替,如下

  • Redis3.2之前,list使用的是linkedlistziplist
  • Redis3.2~Redis7.0之間,list使用的是quickList,是linkedlistziplist的結合
  • Redis7.0之后,list使用的也是quickList,只不過將ziplist轉為listpack,它是listpack、linkedlist結合版

linkedlist與ziplist

Redis3.2之前,linkedlistziplist兩種編碼可以選擇切換,它們之間的轉換關系如圖24b7d754-f2cf-11ed-90ce-dac502259ad0.png

同樣地,ziplist轉為linkedlist的條件可在redis.conf配置

list-max-ziplist-entries 512
list-max-ziplist-value 64

quickList(ziplist、linkedlist結合版)

quicklist存儲了一個雙向列表,每個列表的節點是一個ziplist,所以實際上quicklist并不是一個新的數據結構,它就是linkedlistziplist的結合,然后被命名為快速列表。24c720e2-f2cf-11ed-90ce-dac502259ad0.pngziplist內部entry個數可在redis.conf配置

list-max-ziplist-size -2
# -5: 每個ziplist最多為 64 kb  <-- 影響正常負載,不推薦
# -4: 每個ziplist最多為 32 Kb  <-- 不推薦
# -3: 每個ziplist最多為 16 Kb  <-- 最好不要使用
# -2: 每個ziplist最多為 8 Kb   <-- 好
# -1: 每個ziplist最多為 4 Kb   <-- 好
# 正數為ziplist內部entry個數

ziplist通過特定的LZF壓縮算法來將節點進行壓縮存儲,從而更進一步的節省空間,而很多場景都是兩端元素訪問率最高,我們可以通過配置list-compress-depth來排除首尾兩端不壓縮的entry個數。

list-compress-depth 0
# - 0:不壓縮(默認值)
# - 1:首尾第 1 個元素不壓縮
# - 2:首位前 2 個元素不壓縮
# - 3:首尾前 3 個元素不壓縮
# - 以此類推

quickList(listpack、linkedlist結合版)

和Hash結構一樣,因為ziplist有連鎖更新問題,redis7.0ziplist替換為listpack,下面是新quickList的結構圖

24dfd68c-f2cf-11ed-90ce-dac502259ad0.pngimage

Redis中listpack源碼

typedefstructquicklist{
quicklistNode*head;
quicklistNode*tail;
unsignedlongcount;/*所有列表包中所有條目的總數,占用16bits,最大65536*/
unsignedlonglen;/*quicklistNode的數量*/
signedintfill:QL_FILL_BITS;/*單個節點的填充因子*/
unsignedintcompress:QL_COMP_BITS;/*不壓縮的端節點深度;0=off */
unsignedintbookmark_count:QL_BM_BITS;
quicklistBookmarkbookmarks[];
}quicklist;
typedefstructquicklistNode{
structquicklistNode*prev;
structquicklistNode*next;
unsignedchar*entry;
size_tsz;/*當前entry占用字節*/
unsignedintcount:16;/*listpack元素個數,最大65535*/
unsignedintencoding:2;/*RAW==1orLZF==2*/
unsignedintcontainer:2;/*PLAIN==1orPACKED==2*/
unsignedintrecompress:1;/*當前listpack是否需要再次壓縮*/
unsignedintattempted_compress:1;/*測試用*/
unsignedintextra:10;/*備用*/
}quicklistNode;

listpack內部entry個數可在redis.conf配置

List-Max-listpack-size -2
# -5: 每個listpack最多為 64 kb  <-- 影響正常負載,不推薦
# -4: 每個listpack最多為 32 Kb  <-- 不推薦
# -3: 每個listpack最多為 16 Kb  <-- 最好不要使用
# -2: 每個listpack最多為 8 Kb   <-- 好
# -1: 每個listpack最多為 4 Kb   <-- 好
# 正數為listpack內部entry個數

Set

概述

set 是一個無序的字符串集合,它不允許重復的元素。一個 set 類型的鍵最多可以存儲 2^32 - 1 個元素。

set 類型的底層實現有兩種:

  • intset,整數集合
  • hashtable(哈希表)。哈希表和 hash 類型的哈希表相同,它將元素存儲在一個數組中,并通過哈希函數計算元素在數組中的索引

Redis 會根據 set 中元素的數量和類型來選擇合適的編碼方式,當 set 達到一定的閾值時,會自動轉換編碼方式。

typedefstructintset{
uint32_tencoding;
uint32_tlength;
int8_tcontents[];
}intset;

應用場景

set 類型的應用場景主要是利用集合的特性,比如:

  • 去重,利用 sadd 和 scard 命令實現元素的添加和計數。
  • 交集,并集,差集,利用 sinter,sunion 和 sdiff 命令實現集合間的運算。
  • 隨機抽取,利用 srandmember 命令實現隨機抽獎或者抽樣。

底層原理

在講解set結構之前,需要先說明一下set結構編碼的更替,如下

  • Redis7.2之前,set使用的是intsethashtable
  • Redis7.2之后,set使用的是intset、listpack、hashtable

intset

intset是一種緊湊的數組結構,它只保存int類型的數據,它將所有的元素按照從小到大的順序存儲在一塊連續的內存中。intset會根據傳入的數據大小,encoding分為int16_t、int32_t、int64_t24faeda0-f2cf-11ed-90ce-dac502259ad0.png

127.0.0.1:6379>saddset123
(integer)1
127.0.0.1:6379>objectencodingset
"intset"
127.0.0.1:6379>saddsetabcd
(integer)1
127.0.0.1:6379>objectencodingset
"hashtable"

intset 和 hashtable 的轉換

Redis7.2之前,當一個集合滿足以下兩個條件時,Redis 會選擇使用intset編碼:

  • 集合對象保存的所有元素都是整數值
  • 集合對象保存的元素數量小于等于512個(默認)

intset最大元素數量可在redis.conf配置

set-max-intset-entries 512

為什么加入了listpack

redis7.2之前,sds類型的數據會直接放入到編碼結構式為hashtableset中。其中,sds其實就是redis中的string類型。

而在redis7.2之后,sds類型的數據,首先會使用listpack結構當 set 達到一定的閾值時,才會自動轉換為hashtable。

添加listpack結構是為了提高內存利用率和操作效率,因為 hashtable 的空間開銷和碰撞概率都比較高。

hashtable 的空間開銷高

hashtable 的空間開銷高是因為它需要預先分配一個固定大小的數組來存儲鍵值對,而這個數組的大小通常要大于實際存儲的元素個數,以保證較低的裝載因子。裝載因子是指 hashtable 中已經存儲的元素個數和數組大小的比值,它反映了 hashtable 的空間利用率

  • 如果裝載因子過高,那么 hashtable 的性能會下降,因為碰撞的概率會增加
  • 如果裝載因子過低,那么 hashtable 的空間利用率會下降,因為數組中會有很多空閑的位置

因此,hashtable 需要在裝載因子和空間利用率之間做一個平衡,通常裝載因子的推薦值是 0.75

hashtable 的碰撞概率高

hashtable碰撞概率高是因為它使用了一個散列函數來將任意長度的鍵映射到一個有限范圍內的整數,作為數組的索引

散列函數的設計很重要,它應該盡可能地保證不同的鍵能夠均勻地分布在數組中,避免出現某些位置過于擁擠,而其他位置過于稀疏的情況。然而,由于散列函數的輸出范圍是有限的,而鍵的取值范圍是無限的,所以不可能完全避免兩個不同的鍵被散列到同一個位置上,這就產生了碰撞。碰撞會影響 hashtable 的性能,因為它需要額外的處理方式來解決沖突,比如開放尋址法或者鏈地址法

舉例說明,假設有一個大小為8的hashtable,使用取模運算作為散列函數,即h(k) = k mod 8?,F在有四個鍵:5,13,21,29,它們都被散列到索引1

250c39de-f2cf-11ed-90ce-dac502259ad0.pngimage

這就是一個碰撞的例子,因為四個鍵都映射到了同一個索引。這種情況可能是由于以下原因造成的:

  • 散列函數的選擇不合適,沒有充分利用hashtable的空間。
  • 鍵的分布不均勻,有些區間的鍵出現的頻率更高。
  • hashtable的大小太小,不能容納所有的鍵。

為了解決碰撞,redis采用了鏈地址法。就是在每個索引處維護一個鏈表,存儲所有散列到該索引的鍵。但是,如果鏈表過長,查找效率會降低。因此,一般建議保持hashtable的負載因子(即鍵的數量除以hashtable的大?。┰谝欢ǚ秶鷥?,比如0.5到0.75之間。如果負載因子過高或過低,可以通過擴容或縮容來調整hashtable的大小

intset 、listpack和hashtable的轉換

intset 、listpack和hashtable這三者的轉換時根據要添加的數據、當前set的編碼和閾值決定的。

  • 如果要添加的數據是整型,且當前set的編碼為intset,如果超過閾值由intset直接轉為hashtable

    閾值條件為:set-max-intset-entriesintset最大元素個數,默認512

  • 如果要添加的數據是字符串,分為三種情況

    閾值條件為:set-max-listpack-entries:最大元素個數,默認128set_max_listpack_value:最大元素大小,默認64以上兩個條件需要同時滿足才能進行編碼轉換

    • 當前set的編碼為intset:如果沒有超過閾值,轉換為listpack;否則,直接轉換為hashtable
    • 當前set的編碼為listpack:如果超過閾值,就轉換為hashtable
    • 當前set的編碼為hashtable:直接插入,編碼不會進行轉換

ZSet

概述

Redis 中的 zset 是一種有序集合類型,它可以存儲不重復的字符串元素,并且給每個元素賦予一個排序權重值(score)。Redis 通過權重值來為集合中的元素進行從小到大的排序。zset 的成員是唯一的,但權重值可以重復。一個 zset 類型的鍵最多可以存儲 2^32 - 1 個元素。

Redis中zset源碼

typedefstructzskiplistNode{
sdsele;
doublescore;
structzskiplistNode*backward;
structzskiplistLevel{
structzskiplistNode*forward;
unsignedlongspan;
}level[];
}zskiplistNode;

typedefstructzskiplist{
structzskiplistNode*header,*tail;
unsignedlonglength;
intlevel;
}zskiplist;

typedefstructzset{
dict*dict;
zskiplist*zsl;
}zset;

應用場景

zset 類型的應用場景主要是利用分數和排序的特性,比如:

  • 排行榜,利用 zadd 和 zrange 命令實現分數的更新和排名的查詢
  • 延時隊列,利用 zadd 和 zpopmin 命令實現任務的添加和執行,并且可以定期地獲取已經到期的任務
  • 訪問統計,可以使用 zset 來存儲網站或者文章的訪問次數,并且可以按照訪問量進行排序和篩選。

底層原理

Redis在存儲zset結構的數據,為了達到內存和性能的平衡,針對少量存儲和大量存儲分別設計了兩種結構,分別為:

  • ziplistredis7.0之前使用)和listpack(redis7.0之后使用)
  • skiplist

zset 中的元素個數和元素值的長度比較小的時候,Redis 使用ziplist/listpack來節省內存空間。當 zset 中的元素個數和元素值的長度達到一定閾值時,Redis 會自動將ziplist/listpack轉換為skiplist,以提高操作效率

具體來說,當 zset 同時滿足以下兩個條件時,會使用 listpack作為底層結構:

  • 元素個數小于 zset_max_listpack_entries ,默認值為 128
  • 元素值的長度小于zset_max_listpack_value,默認值為 64

zset 中不滿足以上兩個條件時,會使用 skiplist 作為底層結構。

skiplist

跳躍表是一種隨機化的數據結構,實質就是一種可以進行二分查找的有序鏈表。跳躍表在原有的有序鏈表上面增加了多級索引,通過索引來實現快速查找。跳躍表不僅能提高搜索性能,同時也可以提高插入和刪除操作的性能

2521fc60-f2cf-11ed-90ce-dac502259ad0.pngimage

跳躍表相比于其他平衡樹結構,有以下幾個優點和缺點:

優點:

  • 實現簡單,易于理解和調試
  • 插入和刪除操作只需要修改局部節點的指針,不需要像平衡樹那樣進行全局調整
  • 可以利用空間換時間,通過增加索引層來提高查找效率
  • 支持快速的范圍查詢,可以方便地返回指定區間內的所有元素

缺點:

  • 空間復雜度較高,需要額外存儲多級索引
  • 隨機性太強,性能不穩定,最壞情況下可能退化成鏈表
  • 不支持快速的倒序遍歷,需要額外的指針來實現

redis的skiplist

skiplist有一個層數上的問題,當層數過多,會影響查詢效率。而Redis 使用了一個隨機函數來決定每個節點的層數,這個隨機函數的期望值是 1/(1-p) ,其中 p 是一個概率常數,Redis 中默認為 0.25。這樣可以保證跳躍表的平均高度為 log (1/p) n ,其中 n 是節點數。Redis 還限制了跳躍表的最大層數為 32 ,這樣可以避免過高的索引層造成空間浪費

Stream

概述

stream 是一個類似于日志的數據結構,它可以記錄一系列的鍵值對,每個鍵值對都有一個唯一的 ID。一個 stream 類型的鍵最多可以存儲 2^64 - 1 個鍵值對。

stream 類型的底層實現是 rax(基數樹),它是一種壓縮的前綴樹結構,它將所有的鍵值對按照 ID 的字典序存儲在一個樹形結構中。rax 可以快速地定位、插入、刪除任意位置的鍵值對

應用場景

stream 類型的應用場景主要是實現事件驅動的架構,比如:

  • 消息隊列,利用 xadd 和 xread 命令實現生產者消費者模式。
  • 操作日志,利用 xadd 和 xrange 命令實現操作記錄和回放。
  • 數據同步,利用 xadd 和 xreadgroup 命令實現多個消費者組之間的數據同步。

底層原理

Rax Tree

rax tree是一種基于基數樹(radix tree)的變體,也叫做壓縮前綴樹(compressed prefix tree),它被應用于redis stream中,用來存儲streamID,其數據結構為

typedefstructraxNode{
uint32_tiskey:1;/*Doesthisnodecontainakey?*/
uint32_tisnull:1;/*AssociatedvalueisNULL(don'tstoreit).*/
uint32_tiscompr:1;/*前綴是否壓縮*/
uint32_tsize:29;/*Numberofchildren,orcompressedstringlen.*/
unsignedchardata[];
}raxNode;
  • iskey:是否包含key

  • isnull:是否存儲value值

  • iscompr:前綴是否壓縮。決定了size存儲的是什么和data的數據結構

  • size
    

    • iscompr=0:節點為非壓縮節點,size是孩子節點的數量
    • iscompr=1:節點為壓縮節點,size是已壓縮的字符串長度
  • data
    

    • iscompr=0:節點為非壓縮節點,數據格式為[header strlen=0][abc][a-ptr][b-ptr][c-ptr](value-ptr?)。其有size個字符,
    • iscompr=1:節點為壓縮節點,數據格式為[header strlen=3][xyz][z-ptr](value-ptr?)。

為了便于理解,設定一些場景舉例說明

場景一:只插入foot

數據結構為:

2537abaa-f2cf-11ed-90ce-dac502259ad0.pngimage

其中,z-ptr指向的葉子節點的iskey=1,標識foot這個key。下圖為使用樹狀圖的形式來展現其數據結構2546e2d2-f2cf-11ed-90ce-dac502259ad0.png

場景二:插入foot后,插入footer

數據結構為:

2556ddc2-f2cf-11ed-90ce-dac502259ad0.pngimage

其插入過程為:

  1. foot節點中每個字符進行比較,獲得最大公共前綴foot
  2. er作為foot的子節點,其iskey=1,標識foot這個key
  3. er的子節點的iskey=1,標識footer這個key

下圖為使用樹狀圖的形式來展現其數據結構25675030-f2cf-11ed-90ce-dac502259ad0.png

場景三:插入foot后,插入fo

數據結構為:

2578024a-f2cf-11ed-90ce-dac502259ad0.pngimage

其插入過程為:

  1. foot節點中每個字符進行比較,獲得最大公共前綴fo
  2. foot拆成foot
  3. ot作為fo的子節點,其iskey=1,標識fo這個key
  4. 設置ot的子節點的iskey=1,標識foot這個key

下圖為使用樹狀圖的形式來展現其數據結構258dc76a-f2cf-11ed-90ce-dac502259ad0.png

場景四:插入foot后,插入foobar

數據結構為:

2597fadc-f2cf-11ed-90ce-dac502259ad0.pngimage

其插入過程為:

  1. foot節點中每個字符進行比較,獲得最大公共前綴foo
  2. foot拆成foot
  3. footbar拆成foo、bar
  4. t、b作為foo的子節點
  5. 設置ot的子節點的iskey=1,標識foot這個key
  6. ar作為b的子節點
  7. 設置ar的子節點的iskey=1,標識footbar這個key

下圖為使用樹狀圖的形式來展現其數據結構25a8ef4a-f2cf-11ed-90ce-dac502259ad0.png

Stream

stream的底層使用了rax treelistpack兩種結構,rax tree用來存儲streamID,而listpack用來存儲對應的值,結構圖如下:

25b2305a-f2cf-11ed-90ce-dac502259ad0.pngimage

Hyperloglog

概述

HyperLogLog 是一種概率數據結構,用于在恒定的內存大小下估計集合的基數(不同元素的個數)。它不是一個獨立的數據類型,而是一種特殊的 string 類型,它可以使用極小的空間來統計一個集合中不同元素的數量,也就是基數。一個 hyperloglog 類型的鍵最多可以存儲 12 KB 的數據

hyperloglog 類型的底層實現是 SDS(simple dynamic string),它和 string 類型相同,只是在操作時會使用一種概率算法來計算基數。hyperloglog 的誤差率為 0.81%,也就是說如果真實基數為 1000,那么 hyperloglog 計算出來的基數可能在 981 到 1019 之間

應用場景

hyperloglog 類型的應用場景主要是利用空間換時間和精度,比如:

  • 統計網站的獨立訪客數(UV)
  • 統計在線游戲的活躍用戶數(DAU)
  • 統計電商平臺的商品瀏覽量
  • 統計社交網絡的用戶關注數
  • 統計日志分析中的不同事件數

假如需要統計某商品的用戶關注數,可以通過以下方式:

>PFADDgoodA"1"
1
>PFADDgoodA"2"
1
>PFADDgoodA"3"
1
>PFCOUNTgoodA
3

GEO

概述

geospatial 是一種用于存儲和查詢地理空間位置的數據類型,它基于 sorted set 數據結構實現,利用 geohash 算法將經緯度編碼為二進制字符串,并作為 sorted set 的 score 值。Redis geospatial 提供了一系列的命令來添加、刪除、搜索和計算地理空間位置,例如:

  • GEOADD key longitude latitude member [longitude latitude member …]:將一個或多個地理空間位置(經度、緯度、名稱)添加到指定的 key 中
  • GEOPOS key member [member …]:返回一個或多個地理空間位置的經緯度
  • GEODIST key member1 member2 [unit]:返回兩個地理空間位置之間的距離,可以指定單位(m, km, mi, ft)
  • GEORADIUS key longitude latitude radius unit [WITHCOORD] [WITHDIST] [WITHHASH] [COUNT count] [ASC|DESC] [STORE key] [STOREDIST key]:返回指定圓心和半徑內的地理空間位置,可以指定返回坐標、距離、哈希值、數量、排序方式等,也可以將結果存儲到另一個 key 中
  • GEORADIUSBYMEMBER key member radius unit [WITHCOORD] [WITHDIST] [WITHHASH] [COUNT count] [ASC|DESC] [STORE key] [STOREDIST key]: 返回以指定成員為圓心的指定半徑內的地理空間位置,其他參數同 GEORADIUS

應用場景

geospatial 的應用是地理位置搜索、分析和展示,例如地圖應用、導航應用、位置服務應用等。例如,可以使用 geospatial 來實現以下功能:

  • 統計某個區域內的商家或用戶數量
  • 查詢某個位置附近的餐館或酒店
  • 計算兩個位置之間的距離或行駛時間
  • 顯示某個位置周圍的景點或活動

Bitmap

概述

bitmap 不是一個獨立的數據類型,而是一種特殊的 string 類型,它可以將一個 string 類型的值看作是一個由二進制位組成的數組,并提供了一系列操作二進制位的命令。一個 bitmap 類型的鍵最多可以存儲 2^32 - 1 個二進制位。

bitmap 類型的底層實現是 SDS(simple dynamic string),它和 string 類型相同,只是在操作時會將每個字節拆分成 8 個二進制位。

應用場景

bitmap 類型的應用場景主要是利用二進制位的特性,比如:

  • 統計用戶活躍度,利用 setbit 和 bitcount 命令實現每天或每月用戶登錄次數的統計。
  • 實現布隆過濾器,利用 setbit 和 getbit 命令實現快速判斷一個元素是否存在于一個集合中。
  • 實現位圖索引,利用 bitop 和 bitpos 命令實現對多個條件進行位運算和定位

假如需要統計每個用戶的當天登錄次數統計。

首先,需要規定bitmap的格式,假設為{userid}:{年份}:{第幾天} {秒數} {是否登錄}

userid為100的用戶,記錄他在2024年第100天中第1秒,是否登錄

SETBIT100010011
0

userid為100的用戶,記錄他在2024年第100天中第10240 秒,是否登錄

SETBIT1000100102401
0

userid為100的用戶,記錄他在2024年第100天中第86400 秒,是否登錄

SETBIT1000100864001
0

統計userid為100的用戶,在2024年第100天的登錄次數

BITCOUNT1000100
3

Bitfield

概述

bitfield結構是基于字符串類型的一種擴展,可以讓你對一個字符串中的任意位進行設置,增加和獲取操作,就像一個位數組一樣

可以操作任意位長度的整數,從無符號的1位整數有符號的63位整數。這些值是使用二進制編碼的Redis字符串來存儲的

bitfield結構支持原子的讀,寫和增加操作,使它們成為管理計數器和類似數值的好選擇

使用場景

Bitfield的使用場景與bitmap 類似,主要是一些需要用不同位長度的整數來表示狀態或屬性的場合,例如:

  • 用一個32位的無符號整數來表示用戶的金幣數量,用一個32位的無符號整數來表示用戶殺死的怪物數量,可以方便地對這些數值進行設置,增加和獲取
  • 用一個16位的有符號整數來表示用戶的等級,用一個16位的有符號整數來表示用戶的經驗值,可以方便地對這些數值進行設置,增加和獲取
  • 用一個8位的無符號整數來表示用戶的性別,用一個8位的無符號整數來表示用戶的年齡,可以方便地對這些數值進行設置,增加和獲取

bitfieldbitmap都是基于string類型的位操作,但是有一些區別:

  • bitmap只能操作1位的無符號整數,而bitfield可以操作任意位長度的有符號或無符號整數
  • bitmap只能設置或獲取指定偏移量上的位,而bitfield可以對指定偏移量上的位進行增加或減少操作
  • bitmap可以對多個字符串進行位運算,而bitfield只能對單個字符串進行位操作
  • bitmap的偏移量是從0開始的,而bitfield的偏移量是從最高有效位開始的

例如,使用bitfield存儲用戶的個人信息,

  • 用一個8位的無符號整數來表示用戶的性別,0表示男,1表示女
  • 用一個8位的無符號整數來表示用戶的年齡,范圍是0-255
  • 用一個16位的無符號整數來表示用戶的身高,單位是厘米,范圍是0-65535
  • 用一個16位的無符號整數來表示用戶的體重,單位是克,范圍是0-65535

假設有一個用戶,性別是女,年齡是25,身高是165厘米,體重是50千克,可以用以下命令來存儲和獲取這些信息:

>BITFIELDuserinfoSETu8#01SETu8#125SETu16#2165SETu16#350000
0
0
0
0

然后,獲取這個用戶的信息,性別、年齡、身高、體重

>BITFIELDuserinfoGETu8#0GETu8#1GETu16#2GETu16#3
1
25
165
50000

審核編輯 :李倩


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據庫
    +關注

    關注

    7

    文章

    4019

    瀏覽量

    68339
  • 數據類型
    +關注

    關注

    0

    文章

    237

    瀏覽量

    14185
  • Redis
    +關注

    關注

    0

    文章

    392

    瀏覽量

    12185

原文標題:細說 redis 十種數據類型及底層原理

文章出處:【微信號:cxuangoodjob,微信公眾號:程序員cxuan】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Redis數據類型介紹

    支持五種數據類型:string(字符串),hash(哈希),list(列表),set(集合)及zset(有序集合)。 string(字符串) 字符串類型Redis的最基本數據結構。
    的頭像 發表于 10-09 10:53 ?1369次閱讀
    <b class='flag-5'>Redis</b><b class='flag-5'>數據類型</b>介紹

    Labview各種數據類型

    Labview各種數據類型
    發表于 12-11 11:27

    AD轉換中常用的十種數字濾波法

    AD轉換中常用的十種數字濾波法
    發表于 11-17 08:38

    分布式Redis的五種數據類型

    《分布式_Redis》_概述匯總
    發表于 10-15 10:55

    Redis基本類型底層實現

    簡單介紹了Redis的五對象類型和它們的底層實現。事實上,Redis的高效性和靈活性正是得益于對于同一個對象
    發表于 11-25 15:11 ?7795次閱讀
    <b class='flag-5'>Redis</b>基本<b class='flag-5'>類型</b>和<b class='flag-5'>底層</b>實現

    淺析Redis的5基本數據類型

    多余的話不多說,今天給大家帶來的是 Redis 中的四特殊的數據結構 bitmap,hyperLogLog,bloomFilter,GeoHash 。這四種數據結構其實有點類似于算法
    的頭像 發表于 05-05 23:44 ?3062次閱讀
    淺析<b class='flag-5'>Redis</b>的5<b class='flag-5'>種</b>基本<b class='flag-5'>數據類型</b>

    Redis常見對象類型底層數據結構

    集合(Zset),我們在日常工作中也會經常使用它們。知其然,更要知其所以然,本文將會帶你讀懂這五常見對象類型底層數據結構。 本文主要內容參考自《Redis設計與實現》 1. 對象
    的頭像 發表于 11-14 09:50 ?3822次閱讀
    <b class='flag-5'>Redis</b>五<b class='flag-5'>種</b>常見對象<b class='flag-5'>類型</b>的<b class='flag-5'>底層數據</b>結構

    什么是數據類型轉換

    常用的3種數據類型:1、Python數據類型第一:字符串(str)。 2、Python數據類型第二:整數(int)。 3、Pytho
    的頭像 發表于 02-23 15:21 ?2651次閱讀

    Verilog最常用的2種數據類型

    Verilog 最常用的 2 種數據類型就是線網(wire)與寄存器(reg),其余類型可以理解為這兩種數據類型的擴展或輔助。
    的頭像 發表于 05-29 16:27 ?3607次閱讀
    Verilog最常用的2<b class='flag-5'>種數據類型</b>

    PostgreSQL中可用的各種數據類型

    PostgreSQL是一功能強大的開源關系型數據庫管理系統,具有廣泛的數據類型支持。在本教程中,我們將介紹PostgreSQL中可用的各種數據類型,包括數值、字符串、幾何、時間、日期
    的頭像 發表于 09-19 14:08 ?6091次閱讀

    Redis數據類型有哪些

    Redis數據類型有哪些?有五常用數據類型:String、Hash、Set、List、SortedSet。以及三特殊的
    的頭像 發表于 10-09 10:51 ?1578次閱讀

    Redis底層數據類型

    1. 前言 Redis的鍵值對中的常見數據類型有String (字符串)、List(列表)、Hash(哈希)、Set(集合)、Zset(有序集合)。那么其對應的底層數據結構有SDS(simple
    的頭像 發表于 10-09 14:05 ?1011次閱讀
    <b class='flag-5'>Redis</b><b class='flag-5'>底層數據類型</b>

    redis的五種數據類型

    Redis是一高性能的內存數據庫,常用于緩存、任務隊列、分布式鎖等場景。它提供了多種數據類型來滿足各種不同的需求,包括字符串(string)、哈希(hash)、列表(list)、集合
    的頭像 發表于 11-16 11:06 ?1416次閱讀

    redis的五種數據類型底層數據結構

    Redis是一內存數據存儲系統,支持多種數據結構。這些數據結構不僅可以滿足常見的存儲需求,還能夠通過其
    的頭像 發表于 11-16 11:18 ?1258次閱讀

    redis數據結構的底層實現

    Redis是一內存鍵值數據庫,常用于緩存、消息隊列、實時數據分析等場景。它的高性能得益于其精心設計的數據結構和
    的頭像 發表于 12-05 10:14 ?1312次閱讀