11月25日,達夢召開2020創新產品發佈會。會上,達夢發佈了達夢數據共享集羣、達夢啓雲數據庫、達夢新一代分佈式數據庫、夢圖數據庫四款新產品,與合作伙伴回溯了艱辛的發展歷程,分享了合作中的酸甜苦辣。當下,國內很多公司引進國外源碼包裝成國產,或基於開源數據庫進行二次開發,其中甚至不乏市值破千億的明星公司。相比於引進開源或國外源碼這種短平快的發展模式,達夢則始終堅持自主原創,四十年磨一劍。在數據庫領域,撐起了數據庫自主創新旗幟。

達夢四十年磨一劍終成國產化數據庫領導者

上世紀70年代末,武鋼熱軋車間花費巨資從日本引進了一套無人值守管理系統。爲了防止技術泄密,日本人在調試安裝完設備後,把足足三卡車的技術資料當場銷燬。在現場目睹了這一幕的馮裕才痛下決心,一定要研發出中國人自己的數據庫系統。

當時,甲骨文、微軟、IBM等數據庫產品尚未進入我國,在沒有國外產品可以參考的情況下,馮裕才潛心研究,用了8年時間終於開發出第一套數據庫管理系統CRDS,在之後的幾年裏多次在科技部國產數據庫招標中名列第一,並承接了一批圖形數據庫、標準數據庫、地圖數據庫項目。2000年,達夢公司正式成立,開始邁出商業化的第一步。

商業市場既波瀾壯闊,也充滿暗礁漩渦。由於習慣於在象牙塔中搞研發,對於資本運作不甚瞭解,加上同時期甲骨文、微軟、IBM等外商的產品在國內橫行無阻,達夢的商業化之路非常曲折,公司差點倒閉,馮裕才一度想轉型系統集成商,不賣數據庫產品,而是搭成一套應用系統賣。最艱難的時候馮裕才自己掏錢給員工發工資。很多時候,達夢往往成爲競標中的陪跑者,成爲招標單位用來和外商殺價的工具。

當達夢逐漸適應市場後,國內一些公司引進國外開源技術,或是買IBM公司的源代碼,在一些技術指標上把達夢擠下去。其實,自達夢公司成立以來,有從美國留學回來的學生想把美國公司的源代碼直接賣給達夢,也有美國公司想收購馮裕才的技術團隊,還有人呼籲達夢放棄自主研發,也採用免費的開源技術。面對拿來主義、外資收購、開源技術等誘惑,達夢咬定青山不放鬆,始終堅持自主研發,自己掌握核心技術。

目前,上海浦東新區數據中心、武漢市政府投資項目監管平臺、廣州市信息化服務中心數據中心、重慶市政法系統信息共享平臺、、中鐵建財務共享平臺、吉林財政國庫集中支付、建設銀行業務收發文應用平臺、人民銀行湖北分行金融基礎信息查詢系統、武漢住房公積金核心業務系統、國家智能電網調度指揮系統D5000、南方電網OS2地級主站系統、泰國教育雲平臺等項目均採用達夢數據庫,歷經40年的磨鍊,達夢成爲最純粹的國產化數據庫的領導者。

十二年如一日填補技術空白

數據共享集羣是在多臺服務器上構建高可用性數據庫系統的最佳解決方案,也是數據庫領域技術的制高點,是商業數據庫技術的皇冠,這項關鍵的核心技術在我們的金融、電力、運營商等核心重點的行業市場佔有率超過了60%。在最近幾年“開源運動”和分佈式數據庫、NoSQL數據庫如火如荼的大背景下,共享集羣在重點行業的地位依然無可替代,因爲無論技術的風口怎麼在變,共享集羣的價值無可替代,並仍然被用戶廣泛的認可。

達夢數據共享集羣的關鍵技術也不是一蹴而就的。2008年,國家電網提出數據共享存儲集羣的相關需求。2012年,達夢實現兩個節點,兩臺服務器共享集羣的關鍵技術。不過,這對於達夢而言,只是完成了0到1的突破。拿到了入場門票後,還有更多的工作要做,因爲用戶需要的是一款成熟的產品,後面還有99%的工作需要我們繼續去努力。

在過去幾年裏,達夢數據庫在共享集羣的幾個方面做了持續改進:

一是規模。誠然,國外的共享集羣在實際應用當中絕大多數都是兩個節點打以天下,四個節點用的都不是特別多,但一款商品要想在市場上被廣泛接受,就必須有應對所有場景的能力。目前,達夢數據共享集羣做到了從兩個節點到八個節點規模的支持,並且通過了第三方機構的測試,後續還會繼續向16個節點的規模去做演進。

二是服務中斷的時間問題。對於關鍵核心的業務用戶非常關注,如果以5個9的指標來考量,每年發生一次故障,數據庫可以用於故障處理的時間是5分鐘,如果故障發生頻率提高每個月一次,留給數據庫的時間就是25秒。也就是換句話說,以5個9爲目標,共享存儲集羣如果能夠做到每次故障切換時間控制在25秒以內,就能夠承受每月發生一次系統故障。爲了達到這個目標,達夢通過理論分析,確定了共享存儲集羣架構在故障切換時間方面的理論性優勢,通過持續優化,將故障切換時間從以前的冷備方案的小時級,改進優化到共享集羣的10秒到30秒的速度,基本上完成了5個9的技術要求

三是數據容災。達夢可以向用戶提供從50公里級到1000公里級,以及兩地三中心的容災解決組合方案。在本地或者是在同城基於達夢數據守護技術和達夢數據共享集羣進行組合,可以實現RPO爲0的超級容災。在1000公里級的容災,基於達夢的實時同步技術,可以實現延時爲秒級的數據容災。上面兩項技術的組合,還可以構建兩地三中心的容災解決方案。

四是性能。達夢單機四節點的共享集羣TPC—C值超過了200萬,八節點超過了300萬,具有不錯的橫向擴展能力。可以說,在TPC—C90%操作都是寫操作的業務產品,對於集中式架構而言是一個突破。

五是存儲管理。達夢進一步改進了存儲管理系統,引入了在裸設備之外引入了快設備方式的存儲管理,並且提供了存儲條帶化功能。這兩項特性的引入能夠更好的提供運維便利性和性能表現。

六是平臺支持。實現了對各種主流CPU的全面支持。由於過去只有少數美國公司掌握這項關鍵技術,數據共享集羣此前從來沒有在國產CPU上面跑起來,達夢實現了網信名錄內所有國產CPU均支持。南京某首個基於國產CPU+共享存儲集羣的上線業務系統就是採用了達夢的數據庫。在浙江電網共享存儲集羣支撐了電網的核心業務系統,事關到5000萬人的正常生產和生活的工作,這個系統也是基於達夢數據庫。

這裏有一個測試的數據,在一個寫入操作達到了50%比例的仿真測試場景當中,在四節點規模的集羣下面實現了90%操作的響應時間,不超過1秒,並且吞吐量達到了每秒3000筆業務的成績。

過去,在全世界只有甲骨文、IBM等個別美國公司掌握這項技術,而且沒有開源的技術可以參考,這從側面可以印證這項技術的基礎難度。達夢經過12年的積累,終於掌握了這項關鍵技術,實現與國外的數據庫產品同臺競技。相對於那些只會引進國外源碼或拿開源代碼做修改的公司而言,達夢12年如一日填補國內空白,是尤爲可貴的。

相關文章