机器学习概念

机器学习（监督式）系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测。

标签（Labels）是我们要预测的事物 y

特征（Features）是输入变量 x

样本是指数据的特定实例

模型定义了特征与标签之间的关系

模型生命周期的两个阶段：

回归模型可预测连续值

分类模型可预测离散值

检查多个样本并尝试找出可最大限度地减少损失的模型；这一过程称为经验风险最小化

损失是一个数值，表示对于单个样本而言模型预测的准确程度

降低损失（Reducing loss）：

过拟合是由于模型的复杂程度超出所需程度而造成的

通过降低复杂模型的复杂度来防止过拟合，这种原则称为正则化

泛化：

训练数据集训练出一个模型；

测试数据集测试训练的模型并可以调整模型继续训练测试；

"调整模型"指的是调整您可以想到的关于模型的任何方面，从更改学习速率、添加或移除特征，到从头开始设计全新模型。

引入验证集可以大幅降低过拟合的发生几率；1. 选择在验证集上获得最佳效果的模型。2. 使用测试集再次检查该模型。该工作流程之所以更好，原因在于它暴露给测试集的信息更少。

最后选择效果最好的模型；

从原始数据中提取特征的过程称为特征工程，好特征：

表示 (Representation)：清理数据

特征组合

以最小化损失和复杂度为目标，这称为结构风险最小化

简化正则化 (Regularization for Simplicity)(规则化)

早停法指的是在模块完全收敛之前就结束训练。

逻辑回归是一种极其高效的概率计算机制

逻辑回归的损失函数是对数损失函数

神经网络：在输入和输出间添加隐藏层，添加非线性转换层（激活函数）