本
文
摘
要
最近在看《深入浅出图神经网络》这本书,受益匪浅,记录一下笔记。
举个例子,有一批商品的图片数据需要进行分类。我们需要建立一个模型,并使用这批商品的图片数据训练模型,得到一个对未知图片进行分类的预测模型。
要完成上述功能,在机器学习中通常需要如下步骤:
(1)提取商品图片的特征:为了让计算机准确的识别分类,需要提取一些去区分性的特征,比如衣服的颜色,风格等。这些特征是认为定义的也可以使用算法自动提取,这个过程叫做特征工程。
(2)建立模型:在定义好特征后,需要选择一个合适的模型来建模。传统的机器学习模型有逻辑回归,随机森林等。基于深度学习的方法,有多层感知器,卷积网络等。
模型可以看成一个复杂的函数 y=f(X;W)y=f(X;W) ,其目的是建立输入到标签之间的映射,其中X是前面定义的特征,W的模型的参数。
(3)确定损失函数和进行优化求解:选择模型只是确定了一个模型形式,比如使用逻辑回归,它还包含权值,在这些权值没有确定之前,是无法用它来进行正确的预测的。
那么如何调整模型使得它可以完成有意义的预测呢?首先需要一个数值来量化模型预测的对错,损失函数就是来衡量模型输出和标签之间的差异程度的,当预测结果与标签差异偏大时,损失函数值增大,反之减少。基于损失函数给出的值,可以通过优化方法调整模型以不断减少损失值。
更多机器学习算法(机器学习 周志华)相关信息请关注本站,本文仅仅做为展示!