需要把一个从csv文件里读取来的数据集等距抽样分割,这里用到了列表表达式和dataframe.iloc
先生成索引列表:
index_list = ['%d' %i for i in range(df.shape[0]) if i % 3 == 0]
在dataframe中选取
sample_df = df.iloc[index_list]
合起来
sample_df = df.iloc[['%d' %i for i in range(df.shape[0]) if i % 3 == 0]
有的时候我们可以要根据索引的大小或者值的大小对Series和DataFrame进行排名和排序。
一、排序
pandas提供了sort_index方法可以根据行或列的索引按照字典的顺序进行排序
a、Series排序
1、按索引进行排序
#定义一个Series
s = Series([1,2,3],index=[a,c,b])
#对Series的索引进行排序,默认是升序
print(s.sort_index())
'''
a 1
b 3
c 2
'''