前言

Kubernetes(簡稱K8S)是開源的容器集羣管理系統,可以實現容器集羣的自動化部署、自動擴縮容、維護等功能。它既是一款容器編排工具,也是全新的基於容器技術的分佈式架構領先方案。在Docker技術的基礎上,爲容器化的應用提供部署運行、資源調度、服務發現和動態伸縮等功能,提高了大規模容器集羣管理的便捷性。

基礎概念

Container

Container(容器)是一種便攜式、輕量級的操作系統級虛擬化技術。它使用 NameSpace 隔離不同的軟件運行環境,並通過鏡像自包含軟件的運行環境,從而使得容器可以很方便的在任何地方運行。由於容器體積小且啓動快,因此可以在每個容器鏡像中打包一個應用程序。一對一的關係

POD

Kubernetes 使用 Pod 來管理容器,每個 Pod 可以包含一個或多個緊密關聯的容器。一對多的關係

Node

Node 是 Pod 真正運行的主機,可以是物理機,也可以是虛擬機,也稱爲宿主機。爲了管理 Pod,每個 Node 節點上至少要運行docker 、kubelet 服務。

Namespace

Namespace 是對一組資源和對象的抽象集合,比如可以用來將系統內部的對象劃分爲不同的項目組或用戶組。常見的 pods, services, replication controllers 和 deployments 等都是屬於某一個 namespace 的(默認是 default),而 node, persistentVolumes 等則不屬於任何 namespace

Service

Service 是應用服務的抽象,通過 labels 爲應用提供負載均衡和服務發現。匹配 labels 的 Pod IP 和端口列表組成 endpoints,由 kube-proxy 負責將服務 IP 負載均衡到這些 endpoints 上

網絡通訊方式

瞭解了上面的基本概念後,我們考慮一下K8s集羣中docker容器之間是如何通訊的?我們這裏需要區分一下不同的場景

1)在同一個POD上Container通信

2)同一個Node,不同POD

3)不同Node,不同POD

我們先來看看上面的不同場景是怎麼通信的

同一個POD上Container通信

在k8s中每個Pod中管理着一組Docker容器,這些Docker容器共享同一個網絡命名空間,Pod中的每個Docker容器擁有與Pod相同的IP和port地址空間,並且由於他們在同一個網絡命名空間,他們之間可以通過localhost相互訪問。

什麼機制讓同一個Pod內的多個docker容器相互通信?就是使用Docker的一種網絡模型:–net=container

container模式指定新創建的Docker容器和已經存在的一個容器共享一個網絡命名空間,而不是和宿主機共享。新創建的Docker容器不會創建自己的網卡,配置自己的 IP,而是和一個指定的容器共享 IP、端口範圍等

在k8s中每個Pod容器有一個pause容器有獨立的網絡命名空間,在Pod內啓動Docker容器時候使用 –net=container就可以讓當前Docker容器加入到Pod容器擁有的網絡命名空間(pause容器)

這裏就是爲什麼k8s在調度pod時,儘量把關係緊密的服務放到一個pod中,這樣網絡的請求耗時就可以忽略,因爲容器之間通信共享了網絡空間,就像local本地通信一樣。

同一個Node,不同Pod

上圖就是同一個node,不同pod之間的通信,就是使用linux虛擬以太網設備或者說是由兩個虛擬接口組成的veth對使不同的網絡命名空間鏈接起來,這些虛擬接口分佈在多個網絡命名空間上(這裏是指多個Pod上)。

通過網橋把veth0和veth1組成爲一個以太網,他們直接是可以直接通信的,另外這裏通過veth對讓pod1的eth0和veth0、pod2的eth0和veth1關聯起來,從而讓pod1和pod2相互通信。

不同Node,不同Pod

上圖就是不同node之間的pod通信,Node1中的Pod1如何和Node2的Pod4進行通信的,我們來看看具體流程:

1)首先pod1通過自己的以太網設備eth0把數據包發送到關聯到root命名空間的veth0上

2)然後數據包被Node1上的網橋設備接受到,網橋查找轉發表發現找不到pod4的Mac地址,則會把包轉發到默認路由(root命名空間的eth0設備)

3)然後數據包經過eth0就離開了Node1,被髮送到網絡。

4)數據包到達Node2後,首先會被root命名空間的eth0設備

5)然後通過網橋把數據路由到虛擬設備veth1,最終數據表會被流轉到與veth1配對的另外一端(pod4的eth0)

每個Node都知道如何把數據包轉發到其內部運行的Pod,當一個數據包到達Node後,其內部數據流就和Node內Pod之間的流轉類似了

補充說明:對於如何來配置網絡,k8s在網絡這塊自身並沒有實現網絡規劃的具體邏輯,而是制定了一套CNI(Container Network Interface)接口規範,開放給社區來實現。Flannel就是k8s中比較出名的一個。

flannel

flannel組建一個大二層扁平網絡,pod的ip分配由flannel統一分配,通訊過程也是走flannel的網橋。

每個node上面都會創建一個flannel0虛擬網卡,用於跨node之間通訊。所以容器直接可以直接使用pod id進行通訊。

跨節點通訊時,發送端數據會從docker0路由到flannel0虛擬網卡,接收端數據會從flannel0路由到docker0。

總結

上面老顧介紹了幾種網絡通信的場景,以及他們的通信流程,k8s的網絡通信遠遠不止這些,還有很重要的集羣外如何訪問集羣內部?以及Service訪問是用來做什麼的?下一篇文章老顧就介紹,謝謝!!!

相關文章