Kafka 如何選擇合適的分區數，你選對了嗎？

我們經常會面臨這樣的問題，在確定某個topic下應該設置多少分區數，有時並不知道應該如何設置，如何評估等。或者別人問你當前kafka集羣中，具體的業務topic中分區數是多少，是如何知道需要多少分區或怎麼選擇比較適合的分區數。

結合業務場景和非業務條件

那麼我們應該如何選擇合適的分區數呢？

具體的業務具體分析。

但是前期我們可以根據這些條件： 實際業務場景 （消息總量，消息生產或消費頻率，要求的吞吐量等）、 軟件條件 、 硬件條件 、 負載情況 等，進行大致的評估我們可以設置topic多少分區數。

使用壓測工具，得出最佳分區數

kafka官方也提供了腳本方便我們針對我們的kafka集羣做測試，我們可以測試當前提供的硬件條件進行壓測，得出當前機器環境到底能支持多少分區數，從而達到儘量最優的方案。

生產者性能測試腳本：kafka-producer-perf-test.sh

消費者性能測試腳本：kafka-consumer-perf-test.sh

設置好topic的某個分區數，之後我們可以選擇不同的參數：比如消息發送總量、單條消息大小、吞吐量、acks、消費線程數等等，這樣壓測之後就能得出一份測試報告，報告包含的數據有：50%/90%/95%/99%的消息處理耗時、平均處理耗時、每秒消息發送吞吐量、每秒拉取的消息的字節大小/消息數量、消費總數、再平衡時間、按消息計數/消息大小計算的吞吐量等等。

合適的增加分區數是可以提高吞吐量，但超過一定的閾值之後，吞吐量也會隨之下降。如果生產上對吞吐量有一定的要求，可以在生產機器硬件條件下進行壓測，得出適合你的最優分區數。

吞吐量越高並不會一直與分區數有關

對kafka生產者而言，數據寫入每個分區是可以並行進行的。對kafka消費者而言，每個分區只能給一個消費者線程消費，所以消費組的消費並行度依賴於分區數。這樣看來好像分區數越多，理論上吞吐量應該越高。

但是，事實真的是這樣嗎？

消息中間件kafka的吞吐量並不只是跟分區有關。

消息寫入(生產)的吞吐量與這些有關： 消息大小 、 消息壓縮方式 、 消息發送方式（同步或異步） 、 消息確認類型acks 、 副本因子 等。

同樣，消息消費的吞吐量與業務邏輯消費速度等有關。

分區數與操作系統有關

分區數也不能無限制的增加，因爲其佔用了文件描述符，進程可支配的文件描述符是有限的。

一般如果要設置比較大的分區數，要特別留意是否超過系統的最的大描述符文件。雖然可以通過改系統配置，但是應儘量避免這種，畢竟文件句柄也是有開銷的。

注意消息寫入分區策略

我們知道消費寫入哪個分區，默認或者有些會根據Key計算其應寫入哪個分區，這個時候就要考慮與Key較強關聯的應用是否會影響你的使用場景。