学习 第36页

3.4.3  数据清洗与整理 数据在采集完之后,往往包含着噪声、缺失数据、不规则数据等各种问题,因此需要对其进行清洗和整理工作,主要包括以下内容。 1.数据规范化管理 规范化管理后的数据,才有可能成为一个标准的数据集,其中数据命名的统一是第一步。通常爬取和采集回来的数据没有统一、连续的命名,因此需要制定统一的格式,命名通常不要含有中文字符和不合法字符等,在后续使用过程中不能对数据集进行重命名,否则...

特别声明: 版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。