本篇文章為大家展示了如何在python中操作dataframe,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
實例如下所示:
# -*- coding: utf-8 -*- import numpy as np import pandas as pd from pandas import * from numpy import * data = DataFrame(np.arange(16).reshape(4,4),index = list("ABCD"),columns=list('wxyz')) print data print data[0:2] #取前兩行數據 print'+++++++++++++' print len(data ) #求出一共多少行 print data.columns.size #求出一共多少列 print'+++++++++++++' print data.columns #列索引名稱 print data.index #行索引名稱 print'+++++++++++++' print data.ix[1] #取第2行數據 print data.iloc[1] #取第2行數據 print'+++++++++++++' print data['x'] #取列索引為x的一列數據 print data.loc['A'] #取第行索引為”A“的一行數據, print'+++++++++++++' print data.loc[:,['x','z'] ] #表示選取所有的行以及columns為a,b的列; print data.loc[['A','B'],['x','z']] #表示選取'A'和'B'這兩行以及columns為x,z的列的并集; print'+++++++++++++' print data.iloc[1:3,1:3] #數據切片操作,切連續的數據塊 print data.iloc[[0,2],[1,2]] #即可以自由選取行位置,和列位置對應的數據,切零散的數據塊 print'+++++++++++++' print data[data>2] #表示選取數據集中大于0的數據 print data[data.x>5] #表示選取數據集中x這一列大于5的所有的行 print'+++++++++++++' a1=data.copy() print a1[a1['y'].isin(['6','10'])] #表顯示滿足條件:列y中的值包含'6','8'的所有行。 print data.mean() #默認對每一列的數據求平均值;若加上參數a.mean(1)則對每一行求平均值; print data['x'].value_counts() #統計某一列x中各個值出現的次數: print data.describe() #對每一列數據進行統計,包括計數,均值,std,各個分位數等。 data.to_excel(r'E:\pypractice\Yun\doc\2.xls',sheet_name='Sheet1') #數據輸出至Excel
上述內容就是如何在python中操作dataframe,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注創新互聯行業資訊頻道。