pandas库的常用操作,参考书籍《Pandas Cookbook》,内容干货,推荐下载!movie get_dtype_counts# output the number of columns with each specific data type:
movie. select_dtypes(include['int ]).head(# select only integer columns
movie. filter(1ike=' facebook').head()#1ike参数表示包含此
Pandas是一个非常好用的工具,可以用来处理各种格式的数据,本文主要介绍Pandas中的四种选择数据的方法:
简单的筛选类型有四种,按照标签索引、元素位置以及综合筛选,具体如下:
#select by label : loc
#select by position : iloc
#mixed selection : ix
#使用判断
建立一个DataFrame表,程序如下:
<<<
import pandas as pd
import numpy as np
Pandas库十分强大,但是对于切片操作iloc, loc和ix,很多人对此十分迷惑,因此本篇博客利用例子来说明这3者之一的区别和联系,尤其是iloc和loc。
对于ix,由于其操作有些复杂,我在另外一篇博客专门详细介绍ix。
首先,介绍这三种方法的概述:
loc gets rows (or columns) with particular labels from the index. loc从索引中获取具有特定标签的行(或列)。这里的关键是:标签。标签的理解就是name名字。
iloc
在上一篇博客中,我们已经仔细讲解了iloc和loc,只是简单了提到了ix。这是因为相比于前2者,ix更复杂,也更让人迷惑。
因此,本篇博客通过例子的解释试图来描述清楚ix,尤其是与iloc和loc的联系。
首先,再次介绍这三种方法的概述:
loc gets rows (or columns) with particular labels from the index. loc从索引中获取具有特定标签的行(或列)。
iloc gets rows (or columns) at parti
python版本: 3.6
pandas版本: 0.23.4
行索引
索引行有三种方法,分别是 loc iloc ix
import pandas as pd
import numpy as np
index = [a, b, c, d]
data = np.random.randint(10, size=(4, 3))
df = pd.DataFrame(data, index=index)
0 1 2
a 9 7 1
b 0 0 7
c 2 6 5
d 8 2 5
loc
总括
pandas的索引函数主要有三种:
loc 标签索引,行和列的名称
iloc 整型索引(绝对位置索引),绝对意义上的几行几列,起始索引为0
ix 是 iloc 和 loc的合体
at是loc的快捷方式
iat是iloc的快捷方式
建立测试数据集:
import pandas as pd
df = pd.DataFrame({'a': [1, 2, 3], 'b': ['a', 'b', 'c'],'c': [A,B,C]})
print(df)
a b c
0 1 a A
1 2 b