《R数据科学实战:工具详解与案例分析 》 —2.3.4 replace_na / drop_na/—默认值处理工具

网友投稿 816 2022-05-30

2.3.4 replace_na / drop_na/—默认值处理工具

一旦明确了默认值的替代方式,replace_na和drop_na两个函数就可以通过对指定列的查询来将NA替换成需要的数值,例如,去掉所有存在默认值的观察值。表2-16中列出了函数的功能简介及使用时应注意的事项。读者可以参照帮助文档中的例子结合表2-16中的提示来自行练习这两个函数的功能。

表2-16 函数replace_na和drop_na对比

下面的代码列出了如何使用两个函数:

> df %>%

gather(key, value, -序号) %>%

《R数据科学实战:工具详解与案例分析 》 —2.3.4 replace_na / drop_na/—默认值处理工具

separate(key, c("性别","key")) %>%

replace_na(list(value = "missing"))

> df %>%

gather(key, value, -序号) %>%

separate(key, c("性别","key")) %>%

drop_na()

这里必须提醒一下读者关于默认值替换的情况,将所有默认值全部替换成0是很危险的行为,不推荐使用这种做法,因为0代表该数据是存在的,只是数值为0,而默认值则可能代表数据不存在和存在两种情况,只是因为某些原因而导致数据采集失败。因此对默认值的处理一定要视具体情况而定。

数据挖掘

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:一文为你介绍ServiceComb Service-Center三大高性能优化点
下一篇:【Python3网络爬虫开发实战】1.6.2-Tornado的安装
相关文章