python数据清洗,如何对dataframe数据进行isnull空值区分?
发布于 作者:苏南大叔 来源:程序如此灵动~

最近的几篇文章都是关于python
的数据处理过程中,对空值进行检测的问题的。本文主要涉及的是dataframe
的空值区分问题,主要使用的是df.isnull()
和df.notnull()
。当然,还有其它的辅助操作。

大家好,这里是苏南大叔的“程序如此灵动”博客,这里讲述苏南大叔和计算机代码之间的故事。测试环境:python@3.6.8
,pandas@1.1.5
,numpy@1.24.4
。
测试数据
输出:
.isnull()和.notnull()
输出:
输出:
这里的结果表明:第二列数据a2
,无论空字符串,空格,字符的nan
,都不会被视为null
。

波折线取反操作
输出:
这里的波折线,就起到了一个取反的作用。
where替换【很有用】
和上面的需求一样,只是用where
做原地替换。
输出:
df
代表DataFrame
对象,condition
是一个条件表达式,other
是可选参数,表示当【条件不满足时】替换的值。

空字符串转NaN
关于第二列数据a2:["", "nan", " ", "shu"]
,按照标准的.isnull()
来说,他们都不是空值。但是,对于实际操作来说,空字符串和空格,也是可以认为是空值的。那么,根据这个新的空字符串(空格)的标准,再次进行区分。
输出:
输出:
相关文章
- https://newsn.net/say/python-isnone.html
- https://newsn.net/say/python-isnan.html
- https://newsn.net/say/python-isspace.html
结语
把空值和其他不合理的值,都挑出来。然后进行适当处理,这就是本文的主要内容。更多苏南大叔的python
经验文章,请参考:


