python pandas select_dtypes函数选择变量类型

文章目录

        • python变量类型选择
          • select_dtypes函数
          • 参数取值选择
        • 示例

python变量类型选择
select_dtypes函数
DataFrame.select_dtypes(include=None, exclude=None)     [source]

根据列dtypes返回DataFrame的列的子集。

参数:

include, excludescalarlist-like

要包含/排除的dtype或字符串的选择。必须提供这些参数中的至少一个。

返回值:DataFrame
frame的子集,包括include中的dtypeexclude中的dtype

Raises:ValueError

如果includeexclude都为空,如果包含和排除有重叠的元素,如果传入任何类型的字符串dtype

参数取值选择
  • 要选择所有数字类型,请使用np.number'number'
  • 要选择字符串,您必须使用objectdtype,但是请注意,这将返回所有对象dtype
  • 要选择日期时间,使用np.datetime64'datetime''datetime64'
  • 要选择timedeltas,使用np.timedelta64,'timedelta''timedelta64'
  • 要选择Pandas类别dtype,请使用 'category'
示例
df = pd.DataFrame({
                    'a': [1, 2] * 3,
                    'b': [True, False] * 3,
                    'c': [1.0, 2.0] * 3,
                    'd': ['1','2']*3
                  })
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 6 entries, 0 to 5
Data columns (total 4 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   a       6 non-null      int64  
 1   b       6 non-null      bool   
 2   c       6 non-null      float64
 3   d       6 non-null      object 
dtypes: bool(1), float64(1), int64(1), object(1)
memory usage: 278.0+ bytes
  • 选择字符串类型变量
df.select_dtypes(include='object')

	d
0	1
1	2
2	1
3	2
4	1
5	2
  • 选择浮点数类型变量
df.select_dtypes(include='float')

	c
0	1.0
1	2.0
2	1.0
3	2.0
4	1.0
5	2.0
  • 选择整数型变量
df.select_dtypes(include='int')


0
1
2
3
4
5
  • 选择bool型变量
df.select_dtypes(include='bool')


b
0	True
1	False
2	True
3	False
4	True
5	False
  • 排除bool型变量
	a	c	d
0	1	1.0	1
1	2	2.0	2
2	1	1.0	1
3	2	2.0	2
4	1	1.0	1
5	2	2.0	2

你可能感兴趣的:(pandas使用教程,python,pandas,开发语言)