《Python数据挖掘与机器学习实战》—3.5.2 数据预处理-伙伴云

《Python数据挖掘与机器学习实战》—3.5.2 数据预处理

网友投稿 683 2022-05-28

3.5.2 数据预处理

由于带Adj前缀的数据是除权后的数据，更能反映股票数据特征，所以主要使用的数据特征为调整后的开盘价、最高价、最低价、收盘价和交易额（即Adj.Open、Adj.High、Adj.Low、Adj.Close和Adj.Volume）。

两个数据特征如下：

《Python数据挖掘与机器学习实战》—3.5.2 数据预处理

HL_PCT（股票最高价与最低价变化百分比）：

（3-9）

PCT_change（股票收盘价与开盘价的变化百分比）：

（3-10）

于是，自变量为：Adj.Close、HL_PCT、PCT_change和Adj.Volume。因变量为：Adj.Close。

最后，对自变量数据进行规范化处理，使之服从正态分布。只需要执行以下语句就可以达到预处理的目的，代码如下：

X = preprocessing.scale(X)

使用Sklearn做线性回归，首先导入相关函数：

from sklearn.linear_model import LinearRegression

建立线性回归模型：

clf = LinearRegression(n_jobs=-1)

进行线性模拟：

clf.fit(X_train, y_train)

使用predict()函数对需要预测的数据进行预测：

forecast_set = clf.predict(X_lately)

模型的评估主要使用精度（accuracy）参数。调用线型模型中的精度评估函数score()。

accuracy = clf.score(X_test, y_test)

机器学习 Python 数据挖掘

《Python数据挖掘与机器学习实战》—1.7.4 Jupyter Notebook简介

683 2022-05-28

《Python数据挖掘与机器学习实战》—3.5.2 数据预处理

《Python数据挖掘与机器学习实战》—1.7.4 Jupyter Notebook简介

《Python数据挖掘与机器学习实战》—1.3.3 强化学习

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

家居定制平台是什么？

友情链接

《Python数据挖掘与机器学习实战》—3.5.2 数据预处理

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接