机器学习2-线性回归

网友投稿 826 2022-05-30

前言

本案例观察蟋蟀鸣叫的规律,训练一个模型,预测鸣叫与温度的关系。

蟋蟀在较为炎热的天气里鸣叫更为频繁,数十年来,专业和业余昆虫学者已将每分钟的喵叫和温度方面的数据编入目录。

温度与蟋蟀鸣叫的数据,先了解数据的分布情况:

上图表示每分钟的鸣叫与温度的关系。

此曲线图中能看到随着温度的升,蟋蟀鸣叫次数特增加。鸣叫声与温度之间的关系是线性关系。

可以绘制一条直线来近视地表示这种关系,如下图所示:

虽然图中的每个点不是完全分布在直线上,但基本都在直线附近;线性关系用公式表示如下:

其中:

y是指温度,是预测的值;

m是指直线的斜率;

x是指每分钟的鸣叫声次数,即输入特征的值。

b是指y轴截距。

按照机器学习的方式,写一个模型方程式:

其中:

是指预测的标签(输出值)

b是指偏差(对应y轴截距),一些机器学习文档中,称为

是指特征1的权重。权重与上文中用m表示“斜率”的概念相同。

机器学习2-线性回归

是指特征。(输出向)

要根据新的每分钟的鸣叫声值 推断(预测)温度 ,只需将 值代入此模型即可。

下标(例如 和 )预示着可以用多个特征来表示更复杂的模型。例如,具有三个特征的模型可以采用以下方程式:

参考:https://developers.google.cn/machine-learning/crash-course/descending-into-ml/linear-regression

关键词

偏差(bias),距离原点的截距或偏移。偏差(也称为偏差项)在机器学习模型中用b或 表示。例如,在下面的公式中,偏差为b:

推断(inference),在机器学习中,推断通常指以下过程:通过将训练过的模型应用于无标签样本来做出雨雪。在统计学中,推断是指在某些观察数据条件下拟合分布参数的过程。(请参阅维基百科中有关统计学推断的文章。)

线性回归(linear regression),一种回归模型,通过将输入特征进行线性组合输出连续值。

权重(weight),模型中特征的系数,或深度网络中的边。训练模型的目标是确定每个特征的理想权重。如果权重为0,则相应的特征对模型来说没有任何影响。

机器学习 线性回归

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Android之DrawText详解
下一篇:Netconf协议学习第二期
相关文章