資料檔案格式有xlsx、xls、csv,利用pandas庫可將資料檔案讀取到python中,亦可將python處理好的資料匯出為excel檔案。
讀取xlsx、xls檔案
pandas.read_excel()語法的引數如下:
pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,
names=None,arse_cols=None,date_parser=None,na_values=None,
thousands=None,convert_float=True,has_index_names=None,converters=None,dtype=None,true_values=None,false_values=None,engine=None,squeeze=False,**kwds)
引數講解:
io:待讀取資料檔案的絕對路徑,如'C:Usersmoka1Desktop111.xlsx',讀取的是 111.xlsx這個資料檔案。
sheetname:excel工作表中往往會有多張工作表,該引數是用來指定具體工作表的,python一次只能讀取一個工作表,如sheetname='Sheet1',預設引數0,表示唯讀取excel中的第一張工作表。
header:指定作為列名的行,預設是0,即excel的第一行;若資料不含列名,則設定header=None,python將會用數值命名列名;
names:指定列的名字,需以串列的形式設定;與header的區別在於,names是先將資料讀取後,透過python生成的列名,不同於header的列名在excel資料檔案中;
skiprows:excel中自上而下忽略讀取的行數,用來從頭部跳行讀取資料;
skip_footer:自下而上忽略讀取的行數,用來尾部跳行讀取資料;
index_col:指定列為索引;
na_values:設定缺失值的處理,預設為None,可透過該引數設定為其他取代字元或數值;
匯出為xlsx、xls檔案
df.to_excel(excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True, freeze_panes=None)
df:為python中dataframe資料
excel_writer:待儲存的資料檔案路徑及名稱;如,'C:Usersmoka1Desktop111.xlsx',儲存到桌面為111.xlsx資料檔案;
sheet_name:指定儲存到excel檔案中的哪張工作表,且可命名工作表名稱;
index:是否儲存行索引,預設為True,因為excel中會自動生成行索引,該列可設定為False;
寫在最後
希望以上的內容能對你有所幫助,後續我們也將持續推出實用乾貨,感謝點贊和關注。
歡迎關注我的專欄: