摘要:統計學中,我們通過隨機採集一些人的數據(樣本),來構造樣本函數(統計量),並與統計量的分佈(抽樣分佈)相聯繫,從而爲估計總體的參數和進行不確定性的刻畫提供基礎。在前面幾章中,我們做統計推斷的一個基礎是,我們知道總體來自於哪種分佈(比如總體服從正態分佈),但是我們不知道總體分佈的某些參數(比如均值或方差),於是我們使用基於樣本獲得的信息對總體的參與進行估計與檢驗。

第1章 課程介紹【歡迎學習,學習中有任何疑問請在問答區進行問答,祝愉快學習!】

本章將介紹統計學的思考方式,統計學的整體框架,學習統計學有什麼用,以及統計學與機器學習的密切聯繫;並對學習此門課程講解的形式(編程+可視化)和需要具備的知識和技能進行說明,讓大家從這個課程開始,真正學懂統計學!...

第2章 認識數據【必備基礎知識,不能跳過】

數據是統計學處理的對象,而數據是由變量組成的。本章將講解什麼數據和變量,以及變量的類型和測量尺度。這些基本概念是統計分析的基石。

第3章 描述統計【核心內容,重點學習】

本章講解描述統計的知識,針對不同類型的變量,講解其主要的數字特徵和常用的刻畫數據特徵或兩個變量之間的關係的可視化方法。

第4章 描述統計的編程實現【重點實戰章節,建議跟着老師一起敲代碼實現】

本章對上一章所學知識進行代碼的實現,讓大家對所學知識進行鞏固與應用。

第5章 概率和概率分佈【重點章節,必須掌握的概率論知識】

本章將講解概率的基本概念和性質,這是進行統計推斷的基石,學習離散型和連續型隨機變量及其分佈等。

第6章 樣本和抽樣分佈【重點章節,樣本均值的分佈】

假如我們想了解全中國程序員的工資水平,但是卻無法拿到所有人的數據,該怎麼辦呢?統計學中,我們通過隨機採集一些人的數據(樣本),來構造樣本函數(統計量),並與統計量的分佈(抽樣分佈)相聯繫,從而爲估計總體的參數和進行不確定性的刻畫提供基礎。 ...

第7章 參數估計【點和區間估計】

通常我們無法準確獲知總體參數(比如全中國程序員的平均工資)。在統計學中,我們通過樣本提供的信息來對總體的情況進行估計。我們既可以使用一個數字(點估計)作爲總體估計,也可以使用一個區間(區間估計)代表總體參數可能的範圍。...

第8章 假設檢驗【頻率論方法】

顧名思義,假設檢驗是對假設進行驗證的過程。比如我們有兩個相互關聯的假設:程序員的平均工資等於A(零假設) vs 程序員的平均工資不等於(大於或小於)A。我們基於樣本得到的對總體的估計,就可以和假設中的數字A去進行比較,從而接受或拒絕零假設。在這一過程中,我們還可以對犯錯(比如錯誤地拒絕零假設)的概率進行控制。 ...

第9章 方差分析【多於兩個總體均值的比較方法】

上一章我們講解了單個總體(比如程序員的平均工資是否等於某個數值)和兩個總體的檢驗(比如全國男程序員的工資是否比全國女程序員的工資高)。本章我們將介紹如何拆解和分析結構更加複雜的數據(比如性別和學歷這兩個因素如何交互影響程序員的工資)。 ...

第10章 迴歸分析【重難點,建議多看視頻】

很多時候,數據/變量之間是相互關聯和影響的。比如,我們不僅關心程序員的工資是多少,我們也關心工資是否以及如何隨性別、學歷等因素而變化,這種變化是否受到其他因素(比如年齡)的調節等。這一章,我們不僅講解如何使用迴歸分析刻畫變量之間的關係,更會從迴歸分析的角度去重新審視假設檢驗的方法。此外,我們還會探討統...

第11章 非參數檢驗【重難點,請認真學習】

在前面幾章中,我們做統計推斷的一個基礎是,我們知道總體來自於哪種分佈(比如總體服從正態分佈),但是我們不知道總體分佈的某些參數(比如均值或方差),於是我們使用基於樣本獲得的信息對總體的參與進行估計與檢驗。然而,有些時候,我們並不清楚總體來自於哪種分佈,怎麼辦呢?讓我們一起來進行非參數檢驗。...

第12章 貝葉斯統計【重在掌握方法,請好好學習】

基於頻率論的假設檢驗首先認爲零假設(模型)是正確的,然後通過從樣本獲取的信息來接受或拒絕零假設。那麼,如果我們同時有多個模型,並且想知道基於現有數據,哪個模型最有可能是正確,要怎麼辦呢?貝葉斯統計不僅爲我們解決這類問題提供了方法,而且允許我們隨着數據的積累而對模型正確的可能性進行更新。...

第13章 更廣闊的的統計學世界【祝大家學以致用】

恭喜大家完成了這門課程的學習。本章將回顧和梳理同學們在這門課程中學習到的統計學知識,強化統計學的思維方式,並向大家介紹更廣闊的統計學世界。祝大家收穫滿滿,學習愉快!

下載地址: 專爲程序員設計的統計課 徹底學會統計分析

相關文章