df是一个dataframe,列名为A B C D
具体值如下:
A B C D
0 ss 小红 8
1 aa 小明 d
4 f f
6 ak 小紫 7
dataframe里的属性是不定的,空值默认为NA。
一、选取标签为A和C的列,并且选完类型还是dataframe
df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]
二、选取标签为C并且只取前两行,选完类型还是dataframe
df = df.loc[0:2, ['A', 'C']]
d
数据清洗是一项复杂且繁琐的工作,同时也是整个数据分析过程中最为重要的环节。
在python中空值被显示为NaN。首先,我们要构造一个包含NaN的DataFrame对象。
>>> import numpy as np
>>> import pandas as pd
>>> from pandas import Series,DataFrame
>>> from numpy import nan as NaN
>>
一次,笔者在处理数据时想去除DataFrame中指定列的值为空的这一行,采用了如下做法,但是怎么都没有成功:
# encoding: utf-8
import pandas as pd
import math
import numpy as np
data = pd.read_csv('mydata.csv')
print len(data)
for i in range(len(data)):
if (data['导演'][i] == ‘'):
data = data.drop(
实例如下所示:
from pandas import *
from random import *
df = DataFrame(columns=('lib', 'qty1', 'qty2'))#生成空的pandas表
for i in range(5):#插入一行
df.loc[i] = [randint(-1,1) for n in range(3)]
print df
以上这篇python实现在pandas.DataFrame添加一行就是小编分享给大家的全部内容了,希望能给大家一个参
假设txt文件为:
一、matlab代码
data=importdata('data.txt');
xlswrite('data.xls',data);
二、python代码
利用pandas的DataFrame输出为Excel【但是输出会有索引】
结果为:
import numpy as np
import pandas as pd
def getData(path):
with open(path, 'r') as file:
data = []
for line in f