雪花新聞

誰偷了我的雲主機文件?!

摘要:MySQL服務不斷的在crash,並且備機與主機的現象一樣,打印如下日誌:。5、通過history命令分析root用戶操作記錄,發現用戶使用fio命令對/dev/vdb磁盤(/data卷所在的磁盤)直接進行壓測,壓測有隨機寫、順序寫,而不是寫/data目錄:。

在雲主機的日常運維工作中,我們的工程師經常會遇到用戶上報的文件丟失類問題,原因多種多樣,這些問題對用戶造成了或大或小的困擾。現將其中較典型的場景梳理出來,希望能夠幫助大家規避掉這些風險,防止重複踩坑。

場景一:雲主機重啓後文件丟失

場景二:誤執行rm命令

場景三:文件系統損壞(FIO)

2、放開雲主機磁盤限制後,仍然出現異常;MySQL服務不斷的在crash,並且備機與主機的現象一樣,打印如下日誌:

3、DBA定位,反饋 MySQL的數據文件有問題。
4、在備機上發現,mysql 數據文件所在卷的文件系統有異常並且異常比較嚴重,在該捲上創建創建文件也會失敗:

5、通過history命令分析root用戶操作記錄,發現用戶使用fio命令對/dev/vdb磁盤(/data卷所在的磁盤)直接進行壓測,壓測有隨機寫、順序寫,而不是寫/data目錄:

6、MySQL主節點也有執行相同的 fio 操作,由於fio是繞過文件系統層直接對塊設備進行操作,磁盤的真實數據已經被覆蓋,導致文件已經嚴重破壞,MySQL數據庫無法解析錯誤的數據文件,從而crash。

7、2臺MySQL主機的/data卷數據已經不可靠,需要重新格式化/data卷,並通過備份節點進行恢復數據。

測試完成後,再刪除該文件即可,不然會佔用 -size 參數所指定的空間。

場景四:文件系統損壞(DD)

2、通過dmesg及 /var/log/messages日誌文件看到有大量xfs文件系統的報錯:

3、通過history命令分析root用戶操作記錄,發現root用戶有使用dd 命令對 /dev/vdb 磁盤(/data卷所在的磁盤)直接進行壓測,對/dev/vdb磁盤寫零:

場景五:數據盤被誤刪除

2、在虛擬化控制檯,確認磁盤是否已經刪除(State狀態要爲Ready):

3、如果尚未刪除,可以將雲磁盤重新attach到主機;
4、在雲門戶同步雲磁盤信息。

本文作者:
姚琦:平安科技系統運營部平安雲運營組,經理,領導團隊負責平安雲應用主機的運維工作。
馮明:平安科技系統運營部平安雲運營組,雲計算運維專家,擅長解決Linux OS及計算虛擬化問題。

本文轉自公衆號平安智能運營 WiseOPX。

關於平安智能運營WiseOPX: 平安智能運營WiseOPX是平安集團雲上應用全生命週期運維管理解決方案及平臺,它以數字化經營爲本,融合了平安多年豐富的運營管理思想及最佳實踐,實現多雲管理、雲上應用的高效交付、日常全棧運維、安全合規、業務運營統一管理。

在智能化運維發展的浪潮下,平安運維人積極推行運維全棧線上化、自動化、智能化探索,WiseOPX作爲其豐富實戰經驗的智慧結晶,爲金融業務IT運營提供可快速複製、高效落地的解決方案。

傳統運維已死?運維的出路在哪裏?來 GNSEC 2020 線上峯會看看大廠是怎麼做的。

近期好文:

運維工程師的“打怪升級”,你需要這份 GTD 全面指南

運維平均月薪竟不足1W?公有云市場份額:阿里、騰訊、電信佔前三;華爲關閉私有云意欲何爲?| 一週IT資訊

助力企業轉型,您需要這份調查問卷 | 有獎大調查

“高效運維”公衆號誠邀廣大技術人員投稿,

投稿郵箱:jiachen@greatops.net,或添加聯繫人微信:greatops1118.

點擊閱讀原文,立即報名 GNSEC 2020 線上峯會

點個“在看”,一年不宕機

相關文章