机器学习中的目标函数总结

几乎所有的机器学习算法最后都归结为求解最优化问题，以达到我们想让算法达到的目标。为了完成某一目标，需要构造出一个“目标函数”来，然后让该函数取极大值或极小值，从而得到机器学习算法的模型参数。如何构造出一个合理的目标函数，是建立机器学习算法的关键，一旦目标函数确定，接下来就是求解最优化问题，这在数学上一般有现成的方案。如果你对最优化算法感兴趣，可以阅读SIGAI之前的公众号文章“理解梯度下降法”，“理解牛顿法”，“理解凸优化”，“机器学习中的最优化算法总结”。本文的侧重点是对目标函数的构造进行总结。

下面我们将介绍机器学习中一些典型的目标函数的构造思路，并对各种算法的目标函数做一个总结。按照用途和要解决的问题，机器学习算法可以分为有监督学习，无监督学习，强化学习3种类型。其中，有监督学习又进一步细分为分类问题与回归问题，无监督学习算法分为聚类问题和数据降维问题。概括起来，各类算法要解决的核心问题是：

对于有监督学习中的分类问题与回归问题，机器学习算法寻找一个映射函数：

为输入的样本数据预测出一个实数值或类别标签。不同的是，分类问题要确定样本的类别，即回答“是什么”的问题；回归问题要预测出一个实数值，即回答“是多少”的问题。例如，如果要确定一张图像是猫还是狗，则为分类问题，算法的输入为图像，输出为类别编号。如果我们要根据一个人的年龄、学历、行业等信息预测他/她的收入，则属于回归问题。二者都是要确定上面这种形式的函数。

对于无监督学习的聚类问题，机器学习算法要寻找一个集合的划分，将样本集D划分成多个不相交的子集：

每个样本属于这些子集中的一个，因此可以概括为解决“怎么分的问题”，与分类问题不同的是，这里没有人工事先定义好的类别，因此也没有训练过程。例如，如果要将一批新闻划分为不同类型的，就属于聚类问题，这里没有实现定义好的类，算法自己完成划分，这些类可能是政治、体育、娱乐、经济、军事等。

对于数据降维问题，机器学习算法要寻找一个映射函数，将一个高维向量映射成一个低维向量：

但要尽可能的保留之前向量的一些重要信息。

对于强学习，机器学习算法要为每种状态s下确定一个动作a来执行，即确定策略函数，使得执行这些动作之后得到我们预期的结果：

执行动作后会得到奖励，这个预期的结果是让奖励最大化。例如，用强化学习来实现自动驾驶，要根据当前的路况来决定怎么开车，这里的路况就是状态，开车就是动作，通过控制汽车去我们想去的目的地，这就是目标。

上面这些算法要完成的目标是一个抽象的概念，具体实现时，要通过一个“目标函数”来体现，算法要通过让目标函数取极大值或极小值来确定模型的参数。

有监督学习

首先来看有监督学习，要确定一个映射函数，这个函数带有参数，而参数则通过训练样学习得到。假设映射函数为：

其中θ是模型的参数，如何确定它的值，是训练算法的核心。一般来说，我们称有监督学习的目标函数为“损失函数”，它通过模型对每个训练样本x的预测值y与训练样本的真正标签值y来构造。其含义是，如果算法预测错了，则有损失，因此该函数反映了映射函数的预测值与样本真实标签值之间的误差。让误差最小化，就是让损失函数最小化：