dataframe数据,df.select_dtypes()根据dtype进行数据筛选
发布于 作者:苏南大叔 来源:程序如此灵动~ 我们相信:世界是美好的,你是我也是。平行空间的世界里面,不同版本的生活也在继续...
机器学习操作的结构化数据,基本上就是一个又一个的dataframe
。而实际的代码层面上来说,对于字符数据又是无法处理的。真正能处理的,只有数字或者浮点数等数据。所以,对于dataframe
的数据类型筛选,是比较有必要的。其中一个重要操作就是.select_dtypes()
操作。
大家好,这里是苏南大叔的“程序如此灵动”博客,这里讲述苏南大叔和计算机代码之间的故事。测试环境:python@3.6.8
,pandas@1.1.5
。
测试数据定义
这里定义个dataframe
数据,代码如下:
import pandas as pd
data = pd.DataFrame({
'name' : ['虎子','老许','二赖子','老白','小黑'],
'age' : [5,3,6,8,10],
'weight' : [1.2,3.5,6.1,2.5,3.6],
'good' : [True,True,True,False,False],
'class': ["dog","bird","fish","catty","puppy"]
})
不知道有什么dtype
的话,直接查看df.dtypes
即可。
print(data)
print(data.dtypes)
输出:
name age weight good class
0 虎子 5 1.2 True dog
1 老许 3 3.5 True bird
2 二赖子 6 6.1 True fish
3 老白 8 2.5 False catty
4 小黑 10 3.6 False puppy
name object
age int64
weight float64
good bool
class object
dtype: object
参考文章:
数据筛选
根据dtype
可以进行进一步的数据筛选。
测试代码一:
data_1 = data.select_dtypes(include=['float64', 'int64'])
print(data_1)
输出:
age weight
0 5 1.2
1 3 3.5
2 6 6.1
3 8 2.5
4 10 3.6
测试代码二:
data_2 = data.select_dtypes(include=['object', 'bool'])
print(data_2)
输出:
name good class
0 虎子 True dog
1 老许 True bird
2 二赖子 True fish
3 老白 False catty
4 小黑 False puppy
测试代码三:
data_3 = data.select_dtypes(include=['int64', 'bool'])
print(data_3)
输出:
age good
0 5 True
1 3 True
2 6 True
3 8 False
4 10 False
参考文章:
结语
筛选好目标数据,就可以对数据进行进一步分析了。
如果本文对您有帮助,或者节约了您的时间,欢迎打赏瓶饮料,建立下友谊关系。
本博客不欢迎:各种镜像采集行为。请尊重原创文章内容,转载请保留作者链接。
本博客不欢迎:各种镜像采集行为。请尊重原创文章内容,转载请保留作者链接。