機器學習中的目標函數總結

幾乎所有的機器學習算法最後都歸結爲求解最優化問題，以達到我們想讓算法達到的目標。爲了完成某一目標，需要構造出一個“目標函數”來，然後讓該函數取極大值或極小值，從而得到機器學習算法的模型參數。如何構造出一個合理的目標函數，是建立機器學習算法的關鍵，一旦目標函數確定，接下來就是求解最優化問題，這在數學上一般有現成的方案。如果你對最優化算法感興趣，可以閱讀SIGAI之前的公衆號文章“理解梯度下降法”，“理解牛頓法”，“理解凸優化”，“機器學習中的最優化算法總結”。本文的側重點是對目標函數的構造進行總結。

下面我們將介紹機器學習中一些典型的目標函數的構造思路，並對各種算法的目標函數做一個總結。按照用途和要解決的問題，機器學習算法可以分爲有監督學習，無監督學習，強化學習3種類型。其中，有監督學習又進一步細分爲分類問題與迴歸問題，無監督學習算法分爲聚類問題和數據降維問題。概括起來，各類算法要解決的核心問題是：

對於有監督學習中的分類問題與迴歸問題，機器學習算法尋找一個映射函數：

爲輸入的樣本數據預測出一個實數值或類別標籤。不同的是，分類問題要確定樣本的類別，即回答“是什麼”的問題；迴歸問題要預測出一個實數值，即回答“是多少”的問題。例如，如果要確定一張圖像是貓還是狗，則爲分類問題，算法的輸入爲圖像，輸出爲類別編號。如果我們要根據一個人的年齡、學歷、行業等信息預測他/她的收入，則屬於迴歸問題。二者都是要確定上面這種形式的函數。

對於無監督學習的聚類問題，機器學習算法要尋找一個集合的劃分，將樣本集D劃分成多個不相交的子集：

每個樣本屬於這些子集中的一個，因此可以概括爲解決“怎麼分的問題”，與分類問題不同的是，這裏沒有人工事先定義好的類別，因此也沒有訓練過程。例如，如果要將一批新聞劃分爲不同類型的，就屬於聚類問題，這裏沒有實現定義好的類，算法自己完成劃分，這些類可能是政治、體育、娛樂、經濟、軍事等。

對於數據降維問題，機器學習算法要尋找一個映射函數，將一個高維向量映射成一個低維向量：

但要儘可能的保留之前向量的一些重要信息。

對於強學習，機器學習算法要爲每種狀態s下確定一個動作a來執行，即確定策略函數，使得執行這些動作之後得到我們預期的結果：

執行動作後會得到獎勵，這個預期的結果是讓獎勵最大化。例如，用強化學習來實現自動駕駛，要根據當前的路況來決定怎麼開車，這裏的路況就是狀態，開車就是動作，通過控制汽車去我們想去的目的地，這就是目標。

上面這些算法要完成的目標是一個抽象的概念，具體實現時，要通過一個“目標函數”來體現，算法要通過讓目標函數取極大值或極小值來確定模型的參數。

有監督學習

首先來看有監督學習，要確定一個映射函數，這個函數帶有參數，而參數則通過訓練樣學習得到。假設映射函數爲：

其中θ是模型的參數，如何確定它的值，是訓練算法的核心。一般來說，我們稱有監督學習的目標函數爲“損失函數”，它通過模型對每個訓練樣本x的預測值y與訓練樣本的真正標籤值y來構造。其含義是，如果算法預測錯了，則有損失，因此該函數反映了映射函數的預測值與樣本真實標籤值之間的誤差。讓誤差最小化，就是讓損失函數最小化：