你知道 Kaggle 麼?不知道你就真的輸了。幾乎每個在數據領域有追求的人,都或多或少有和 Kaggle 打過交道或者有想要參加的 Kaggle 的想法。但是對於初入數據領域的小白來說,連搞清楚 Kaggle 的具體規則都不是一件非常容易的事情,這就讓我們多了一份使命和責任。全網唯一一家真正指導學生參加 Kaggle 的數據科學訓練營。我們希望的不僅僅是給學生最有用的知識,更是希望學生能夠最高效地瞭解並參與到這個數據的大圈子裏。

Kaggle 競賽是全球最大的數據建模和數據分析競賽,也是全球範圍內的數據科學家聚集與競技的平臺。數據科學家可以在該平臺上參與由各大企業發佈的競賽項目,通過分析和建模來解決企業急需解決的問題。

我們的學員在完成基礎知識的學習後,會在我們專業導師的帶領下參加經由老師認真挑選的具有較大商業價值,且當期正在進行的 Kaggle 競賽項目,真正通過實際的應用來鞏固所學習到的知識。

今天就讓我們看看我們以往的數據科學訓練營的兩個精選 Kaggle 比賽吧!

Avito

當在線銷售二手商品時,產品描述中微小細緻的細節組合可以在鼓勵購買興趣方面產生重大影響。比如:

而且,即使有優化的產品列表,對產品的需求也可能根本不存在 - 令人沮喪的賣家可能已經過度投入營銷。

俄羅斯最大的分類廣告網站Avito對此問題非常熟悉。平臺上的賣家有時會因爲需求太少(表示產品或產品列表出現問題)或需求過多而感到沮喪(表明具有良好描述的熱門產品價格過低)。

在這次的kaggle比賽中,老師帶領我們的同學進行Avito的比賽,我們將根據其完整描述(標題,描述,圖像等),其背景(地理位置,發佈的類似廣告)和歷史需求來預測在線廣告的需求。對於類似情況下的類似廣告。有了這些信息,Avito可以告知賣家如何最好地優化他們的列表,並提供他們應該實際期望獲得多少購買興趣的一些指示。

在具體競賽過程中呢,我們從問題解讀,目標確立,數據預處理,探索性數據分析,特徵工程(feature engineering),集成學習算法(model ensemble)這裏麪包括kaggle當下比賽最火最快的模型,XGboost和LightGBM,來最終對Avito提出的問題進行預測。

在這次比賽中,數據量高達將近150G,所以在老師的帶領下,對於怎麼進行大型數據的處理已經分析,同學將會得到很好的學習經驗。

此次比賽一共1917個團隊參加,共計2427個競賽者。此次比賽是獎金型比賽。

1st Place - $12,000

2nd Place - $8,000

3rd Place - $5,000

TalkingData

欺詐風險無處不在,但對於在網上投放廣告的公司而言,點擊欺詐可能會以壓倒性的數量發生,從而導致誤導點擊數據和浪費金錢。廣告渠道只需點擊廣告即可提高成本。中國每月有超過10億的智能移動設備正在使用,因此中國是世界上最大的移動市場,因此遭受大量的欺詐性流量。

TalkingData 是中國最大的獨立大數據服務平臺,覆蓋全國 70% 以上的有源移動設備。他們每天處理30億次點擊,其中 90% 可能是欺詐性的。他們目前防止應用開發者點擊欺詐的方法是衡量用戶點擊其產品組合的過程,並標記產生大量點擊的IP地址,但永遠不會最終安裝應用。有了這些信息,他們就建立了一個IP黑名單和設備黑名單。

雖然成功,但他們希望始終比欺詐者領先一步,並向Kaggle 社區尋求幫助,以進一步開發他們的解決方案。在與 Kaggle 的第二場比賽中,您面臨的挑戰是構建一種算法,用於預測用戶在點擊移動應用廣告後是否會下載應用。爲了支持您的建模,他們提供了一個慷慨的數據集,涵蓋了4天內大約2億次點擊!

這一次的 Kaggle 競賽

1st Place - $12,500

2nd Place - $7,500

3rd Place - $5,000

時間線:

April 30, 2018 - 必須在這個時間之前加入比賽

April 30, 2018 - 這個時間之後參賽隊伍不能再有變動

May 7, 2018 - 最終提交的截止日期

你是不是想問我們學員的比賽結果啦?

他們都超!級!優!秀!

截止到目前,我們輔導的學員在 Kaggle 競賽中取得了很好的成績,多次拿到單個項目的前3%的名次,並在2016年8月取得了一枚寶貴的競賽金牌!優秀的 Kaggle 競賽過程將會成爲學員的應聘時的一段寶貴經歷。截至2018年初,數據應用學院的莘莘學子們已經在 Kaggle 比賽中獲得1枚金牌,4枚銀牌及12枚銅牌!

是不是心動了!

快來報名我們的數據科學訓練營

如果你不僅僅想要職業輔導,你想要從頭開始紮實你的基礎,或者從0開始學習數據科學,這一次機會你不能放棄了,數據科學家訓練營動力起航,我們給你最完備的教學計劃。

課程週期:16周

課程形式:

Online Webinar 實時互動 + 視頻回放

課程時間:

Saturday 13:00 – 15:00 PT

Saturday 17:00 – 19:00 PT

Sunday 17:00 – 19:00 PT

Tuesday 17:00 – 19:00 PT

助教知識點答疑:

Wednesday

17:00 – 19:00 PT

Friday

15:00 – 17:00 PT

助教作業答疑:

Saturday 15:30 – 16:30 PT

100 節精選先修課打基礎,8周乾貨滿滿的數據科學課程帶你變身數據達人,10位 "FLAG" 名師爲你授業解惑,3個 industrial project 帶你體驗實戰打碼到天明的樂趣,什麼?還不夠刺激?我們帶你衝頂 Kaggle 大賽,給你內推,幫你改簡歷,給你個性化職業輔導,最有經驗的導師幫你 mock interview 給你建議,你想要的,我們都能給你。

部分知識點概覽

<< 滑動查看其他知識點 >>

還等什麼?快來諮詢吧!

報滿即止

相關文章