雪花新聞

Redis 高可用性實踐

0×01 前言

Redis 是一個開源的使用 ANSI C 語言編寫、支持網絡、可基於內存亦可持久化的日誌型、Key-Value 數據庫,並提供多種語言的 API。

如今,互聯網業務的數據正以更快的速度在增長,數據類型越來越豐富,這對數據處理的速度和能力提出了更高要求。Redis 是一種開源的內存非關係型數據庫,給開發人員帶來的體驗是顛覆性的。在自始至終的設計過程中,都充分考慮高性能,這使得 Redis 成爲當今速度最快的 NoSQL 數據庫。

考慮高性能的同時,高可用也是很重要的考慮因素。互聯網 7×24 無間斷服務,在故障期間以最快的速度 Failover,能給企業帶來最小的損失。

那麼,在實際應用中,都有哪些高可用架構呢?架構之間有何優劣?我們應該怎麼取捨?有哪些最佳實踐?

0×02 Sentinel 原理

在講解 Redis 高可用方案之前,我們先來看看 Redis Sentinel 原理是怎麼樣的。

  1. Sentinel 集羣通過給定的配置文件發現 master,啓動時會監控 master。通過向 master 發送 info 信息獲得該服務器下面的所有從服務器。

  2. Sentinel 集羣通過命令連接向被監視的主從服務器發送 hello 信息 (每秒一次),該信息包括 Sentinel 本身的 IP、端口、id 等內容,以此來向其他 Sentinel 宣告自己的存在。

  3. Sentinel 集羣通過訂閱連接接收其他 Sentinel 發送的 hello 信息,以此來發現監視同一個主服務器的其他 Sentinel;集羣之間會互相創建命令連接用於通信,因爲已經有主從服務器作爲發送和接收 hello 信息的中介,Sentinel 之間不會創建訂閱連接。

  4. Sentinel 集羣使用 ping 命令來檢測實例的狀態,如果在指定的時間內(down-after-milliseconds)沒有回覆或則返回錯誤的回覆,那麼該實例被判爲下線。

  5. 當 failover 主備切換被觸發後,failover 並不會馬上進行,還需要 Sentinel 中的大多數 Sentinel 授權後纔可以進行 failover,即進行 failover 的 Sentinel 會去獲得指定 quorum 個的 Sentinel 的授權,成功後進入 ODOWN 狀態。如在 5 個 Sentinel 中配置了 2 個 quorum,等到 2 個 Sentinel 認爲 master 死了就執行 failover。

  6. Sentinel 向選爲 master 的 slave 發送 SLAVEOF NO ONE 命令,選擇 slave 的條件是 Sentinel 首先會根據 slaves 的優先級來進行排序,優先級越小排名越靠前。如果優先級相同,則查看複製的下標,哪個從 master 接收的複製數據多,哪個就靠前。如果優先級和下標都相同,就選擇進程 ID 較小的。

  7. Sentinel 被授權後,它將會獲得宕掉的 master 的一份最新配置版本號 (config-epoch),當 failover 執行結束以後,這個版本號將會被用於最新的配置,通過廣播形式通知其它 Sentinel,其它的 Sentinel 則更新對應 master 的配置。

1 到 3 是自動發現機制:

4 是檢測機制,5 和 6 是 failover 機制,7 是更新配置機制。[1]

0×03 Redis 高可用架構

講解完 Redis Sentinel 原理之後,接下來講解常用的 Redis 高可用架構

接下來配合圖文逐個講解。

3.1 Redis Sentinel 集羣 + 內網 DNS + 自定義腳本

上圖是已經在線上環境應用的方案。底層是 Redis Sentinel 集羣,代理着 Redis 主從,Web 端連接內網 DNS 提供服務。內網 DNS 按照一定的規則分配,比如 xxxx.redis.cache/queue.port.xxx.xxx,第一個段表示業務簡寫,第二個段表示這是 Redis 內網域名,第三個段表示 Redis 類型,cache 表示緩存,queue 表示隊列,第四個段表示 Redis 端口,第五、第六個段表示內網主域名。

當主節點發生故障,比如機器故障、Redis 節點故障或者網絡不可達,Sentinel 集羣會調用 client-reconfig-script 配置的腳本,修改對應端口的內網域名。對應端口的內網域名指向新的 Redis 主節點。

優點:

缺點:

3.2 Redis Sentinel 集羣 + VIP + 自定義腳本

此方案和上一個方案相比,略有不同。第一個方案使用了內網 DNS,第二個方案把內網 DNS 換成了虛擬 IP。底層是 Redis Sentinel 集羣,代理着 Redis 主從,Web 端通過 VIP 提供服務。在部署 Redis 主從的時候,需要將虛擬 IP 綁定到當前的 Redis 主節點。當主節點發生故障,比如機器故障、Redis 節點故障或者網絡不可達,Sentinel 集羣會調用 client-reconfig-script 配置的腳本,將 VIP 漂移到新的主節點上。

優點:

缺點:

3.3 封裝客戶端直連 Redis Sentinel 端口

部分業務只能通過外網訪問 Redis,上述兩種方案均不可用,於是衍生出了這種方案。Web 使用客戶端連接其中一臺 Redis Sentinel 集羣中的一臺機器的某個端口,然後通過這個端口獲取到當前的主節點,然後再連接到真實的 Redis 主節點進行相應的業務員操作。需要注意的是,Redis Sentinel 端口和 Redis 主節點均需要開放訪問權限。如果前端業務使用 Java,有 JedisSentinelPool 可以複用;如果前端業務使用 PHP,可以在 phpredis 的基礎上做二次封裝。

優點:

缺點:

3.4 Redis Sentinel 集羣 + Keepalived/Haproxy

底層是 Redis Sentinel 集羣,代理着 Redis 主從,Web 端通過 VIP 提供服務。當主節點發生故障,比如機器故障、Redis 節點故障或者網絡不可達,Redis 之間的切換通過 Redis Sentinel 內部機制保障,VIP 切換通過 Keepalived 保障。

優點:

缺點:

3.5 Redis M/S + Keepalived

此方案沒有使用到 Redis Sentinel。此方案使用了原生的主從和 Keepalived,VIP 切換通過 Keepalived 保障,Redis 主從之間的切換需要自定義腳本實現。

優點:

缺點:

3.6 Redis Cluster

From: http://intro2libsys.com/focused-redis-topics/day-one/intro-redis-cluster

Redis 3.0.0 在 2015 年 4 月 2 日正式發佈,距今已有兩年多的時間。Redis 集羣採用 P2P 模式,無中心化。把 key 分成 16384 個 slot,每個實例負責一部分 slot。客戶端請求對應的數據,若該實例 slot 沒有對應的數據,該實例會轉發給對應的實例。另外,Redis 集羣通過 Gossip 協議同步節點信息。

優點:

缺點:

3.7 Twemproxy

From: http://engineering.bloomreach.com/the-evolution-of-fault-tolerant-redis-cluster

多個同構 Twemproxy(配置相同)同時工作,接受客戶端的請求,根據 hash 算法,轉發給對應的 Redis。

Twemproxy 方案比較成熟了,之前我們團隊長期使用此方案,但是效果並不是很理想。一方面是定位問題比較困難,另一方面是它對自動剔除節點的支持不是很友好。

優點:

缺點:

3.8 Codis

From: https://github.com/CodisLabs/codis

Codis 是由豌豆莢開源的產品,涉及組件衆多,其中 ZooKeeper 存放路由表和代理節點元數據、分發 Codis-Config 的命令;Codis-Config 是集成管理工具,有 Web 界面供使用;Codis-Proxy 是一個兼容 Redis 協議的無狀態代理;Codis-Redis 基於 Redis 2.8 版本二次開發,加入 slot 支持,方便遷移數據。

優點:

缺點:

0×04 最佳實踐

所謂的最佳實踐,都是最適合具體場景的實踐。

主推以下方案:

以下是實戰過程中總結出的最佳實踐:

相關文章