掌握excel线性回归技巧助力数据分析与决策优化
793
2022-05-30
1、使用场景介绍
场景说明:某设备的运行会出现3种故障(Abnromal1、Abnormal2、Abnormal3)和正常状态(Normal)。
训练数据:提供了6个文件,每个文件包含2维度数据,每个文件表示一个时间序列,每一行表示某个时间点采集的2维数据。
测试数据:提供了56个文件,每个文件包含2维数据,每个文件表示一个时间序列。
2、数据理解
初步理解:这属于一个分类问题,需要对已知的数据进行标签训练,进而对未标签的进行分类。其中1个文件为1个类标签,1个文件有3行54列,其中第1列属于时间序列,第2列是输入值,第3列是输出值。其中每个文件的第1列的时间都一样,可以不予以考虑,也就是说有2维特征。训练数据有6个文件,其中前4个文件分别为3类故障和正常状态,最后2个文件为正常状态的数据,可用于进行模型验证。
深层理解:若通过上述进行分类效果不佳,可以对数据进行整理,提取其他特征。对数据进行初步显示分析,如下:
从二维图可见,故障1和2/3以及正常状态很明显可以分开,但是在故障2和3之间存在重叠,根据这个问题可以进行特征提取,基本思路是可以增加统计类特征,如每隔几个数据进行统计均值、方差,中值,最大和最小等。这样形成一个新的数据。最终选取哪些特征需要进行整理验证。
重新标记如下:
4、实验验证
数据整理完成后,则进行建模验证,建模如下:
模型中上面的从数据集读取数据读取的是训练数据,下面的从数据集读取数据是验证数据,上面的分类方法可以进行更换。
如果模型调整好后,可以将模型保存下来,进行使用流程,如下:
看到运行成功可以查看保存的数据集文档,由于一个文件可能有不同的分类结果,对分类结果进行统计,从而给出最终结果。
云市场
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。