需要把一个从csv文件里读取来的数据集等距抽样分割,这里用到了列表表达式和dataframe.iloc
先生成索引列表:
index_list = ['%d' %i for i in range(df.shape[0]) if i % 3 == 0]
在dataframe中选取
sample_df = df.iloc[index_list]
合起来
sample_df = df.iloc[['%d' %i for i in range(df.shape[0]) if i % 3 == 0]
前言
最近在网上搜了许多关于pandas.DataFrame的操作说明,都是一些基础的操作,但是这些操作组合起来还是比较费时间去正确操作DataFrame,花了我挺长时间去调整BUG的。我在这里做一些总结,方便你我他。感兴趣的朋友们一起来看看吧。
一、创建DataFrame的简单操作:
1、根据字典创造:
In [1]: import pandas as pd
In [3]: aa={'one':[1,2,3],'two':[2,3,4],'three':[3,4,5]}
In [4]: bb
python版本: 3.6
pandas版本: 0.23.4
行索引
索引行有三种方法,分别是 loc iloc ix
import pandas as pd
import numpy as np
index = [a, b, c, d]
data = np.random.randint(10, size=(4, 3))
df = pd.DataFrame(data, index=index)
0 1 2
a 9 7 1
b 0 0 7
c 2 6 5
d 8 2 5
loc