圖片來源@視覺中國

【本文來自鈦媒體特色欄目「快公司」

近日,程序代碼庫分析平臺思碼逸宣佈於去年9月完成520萬美元A輪融資,本輪融資由經緯中國領投,GGV、聯想之星、Polychain等既有投資者跟投,資金將用於技術投入與產品迭代。

據公開資料顯示,思碼逸由清華大學計算機科學與技術博士任晶磊於2018年創立,同年3月獲Polychain Capital 和 OSS Capital 110 萬美元天使輪投資;2020年5月獲得由GGV領投、聯想之星和Polychain 跟投的410萬美元Pre-A輪融資;9月再獲得經緯中國領投520萬美元A輪融資。

成立不到4年連續獲得3輪融資,思碼逸對投資人究竟有何吸引力?鈦媒體藉由本次融資,專訪了思碼逸創始人任晶磊。

思碼逸Merico創始人:任晶磊

一篇論文開啓創業之旅

“在國際級軟件工程會議FSE發表論文《Towards Quantifying the Development Value of Code Contributions》是思碼逸項目研發的基本框架和最基礎的技術,也是產品到解決方案的一個支撐,就像當年谷歌的兩個創始人發表Page Rank一樣,從那篇論文開始,一直打造出如今的谷歌搜索引擎以及整個商業帝國。”任晶磊向鈦媒體講述道。

任晶磊2016年從清華計算機博士畢業後,在斯坦福大學、卡內基梅隆大學擔任訪問學者從事關於軟件系統的研究,同時也爲開源社區貢獻代碼,之後加入微軟研究院工作。

在微軟研究院工作期間,他了解到Facebook採用統計代碼行數的簡單粗暴方式來決定獎金,這讓他意識到企業對於量化程序員的工作是有需求的。但是這種方式並不適用於所有團隊,他開始思考,既然做程序分析,能不能通過一些更智能和深度分析的方式來測量程序員的工作。

同時,還有一個問題一直在困擾着他,多年來他們一直在社區貢獻開源代碼。現在很多開源項目已收到一些捐款,如何合理分配這些捐款一直是他在思考的問題。如何讓程序員的智力成果獲得長期的收益,從而促進整個開源社區的繁榮,特別是今天有92%的應用都依賴於開源軟件。

基於以上兩個因素,任晶磊決定爲量化程序員工作、開源社區做些什麼。於是,2018年底他與殷和政、Roland一起創建了思碼逸,主營業務就是通過深度代碼分析技術,主要包括程序分析和人工智能,來量化程序員的工作。

新場景、新數據、新架構

根據Evans Data Group 2019年報告,全球開發者規模達2390萬,預計5年內將增長至2870萬。同時隨着人力成本的不斷攀升,開發者的成本又居於前列,研發團隊由粗放增長轉型精細化管理、效能提升的需求越發迫切。

思碼逸2019年初上線的企業版產品,是在深度代碼分析技術與機器學習技術的基礎上,從歷史及當前代碼庫中提取回溯數據、實時分析並反饋,爲企業提供軟件工程管理與人才發展解決方案,以更智能的度量驅動管理升級,推動開發團隊與開發者個人共同提升。

目前市面上廣泛使用的工作時長、代碼行數(LOCs,Line of Codes)、提交次數(NOCs,Number of Commits)等指標較爲“簡單粗暴”,很容易被換行、死代碼等噪音所幹擾。

而思碼逸的代碼分析引擎是將代碼編譯爲抽象語法樹,辨別每一次提交所產生的代碼邏輯量變化,從而進行工作量的判斷;此外,分析引擎也能夠從代碼間調用關係中分析出函數影響力,再結合代碼質量以及代碼對項目整體質量的影響,能夠較爲準確、客觀反映開發者的工作價值。目前該分析引擎已支持15種開發語言,且正在持續補充中。

產品上線以來,已服務了騰訊、滴滴出行、和訊網、工銀瑞信、長亭科技、知道創宇、百融雲創、票易通、開思汽配、微鯉科技等多行業客戶,這也側面反映出企業對研發效能提升的迫切需求。

任晶磊表示,針對不同行業客戶的需求,產品不斷升級至3.0,將從新場景、新數據、新架構三個維度對產品進行全面優化。

新場景

高管、技術負責人、項目經理、開發者角色,不同角色所需的效能數據側重點與顆粒度有多不同,思碼逸針對不對角色、使用場景出發,重構了產品內的信息框架。

高管角色下跨團隊效率對比視圖

具體而言,高管能夠快速縱覽不同團隊或項目的研發效能狀態與趨勢,基於行業效能參考基線,精準指導團隊提升方向;項目經理則能夠實時把握具體迭代進度,回顧項目效率、質量與穩定性,快速發現並響應瓶頸;技術經理能則夠持續追蹤技術債堆積,在軟件開發週期的各個階段識別風險,精細洞察每位開發者的產出效率與質量,及時激勵優秀成員;開發者能夠藉助量化的研發效能,直觀地展示自己的貢獻,快速識別自己的代碼可優化空間,以及如何優化,從而自發提升工程質量,提高軟件製品的可維護性。

新數據

在既有的代碼分析數據基礎上,接入了JIRA的研發流程管理數據,一方面讓研發效能數據匯於一處,方便管理者從多個視角瞭解研發流程及成果;另一方面,這些指標能夠與既有效率和質量指標交叉分析,產生更加深入的洞見,幫助管理者及時感知研發動向。

支持開發當量多種指標和迭代進度圖

同時, 3.0版本補充了基於開源項目的行業效能數據。根據企業項目的規模及語言,思碼逸系統能自動匹配近似的優秀開源項目,提供外部基線參考,幫助研發管理者快速定位自身團隊在行業中所處的水平,客觀認知提升方向。

行業水平視圖

新架構

任晶磊表示,在服務滴滴、騰訊、泰康人壽等大型企業的時候90%採用的是私有化部署形式,發現企業不僅組織結構複雜,項目層級繁多,且代碼量巨大,可能有上萬個代碼庫、幾十TB代碼,規模超過早期產品版本可支持的範圍。

爲了解決這一問題,在發佈3.0版本中,思碼逸夠支持複雜組織與項目結構,快速導入與配置,提升了客戶的啓動速度,優化了使用體驗;同時,底層的分析引擎也進行了技術重構,基於K8s的分佈式計算能力,目前已能支持萬級代碼庫的導入與分析,滿足大型研發團隊的需要。

深耕代碼分析市場,引入AI專家系統

任晶磊表示,“未來將會在兩方面加大投入,一方面繼續深耕代碼分析市場;另一方面引入AI專家系統協助企業更好解讀分析出的數據。”

具體而言,深耕代碼分析市場方面,將繼續打通研發流程中的前後環節,接入更廣泛的研發數據,如漏洞缺陷數據、性能測試、日誌分析等,將不同數據交叉分析,使研發過程及成果整體可追溯,爲研發管理提供更完整深入的洞見,帶來新的商業價值。

引入AI專家系統方面,將現有的輕諮詢服務進一步產品化,提升系統解讀數據、發現問題、判斷趨勢的能力,使數據分析能夠更直接地助力研發管理決策。

對於企業盈利方面,任晶磊的思考是,目前以企業版產品私有化部署爲主,訂閱方式收費,因爲截止2021年前4個月已實現了去年全年銷售額的150%,到期客戶全部留存的業績。同時也預計今年將上線公有云服務,爲中小企業客戶提供更加便捷高效的部署與使用體驗。

此外,還在2020年底發佈了開源社區版本Merico Build,免費爲開源項目提供效能和社區活躍度分析,爲開源貢獻者提供個人貢獻報告。

希望通過公有云服務與社區版產品的推動,持續沉澱研發效能數據、優化底層計算引擎,打造具有公信力的深度代碼分析引擎,成爲開發者及開發團隊貢獻分析、效能分析、勝任力分析等方面的行業標準。

相關文章