pandas遍历文件夹中所有Excel且合并数据并另存为新的Excel文件

今天研究的是遍历文件夹中所有Excel且合并Excel中所有的数据,当然,前提是所有的Excel格式都是一样的
网上搜索了一下,分享python代码

import os
import pandas as pd
import xlrd
import openpyxl
from openpyxl import load_workbook
path = r'c:\1' #合并表的目录
data = pd.DataFrame(columns=['ID','Name','Code','Mail'])
for parents,dirnames,filenames in os.walk(path):
    for filename in filenames:
        df=pd.read_excel(os.path.join(parents,filename))
        data = data.append(df,ignore_index=False)
        data.to_excel('data.xlsx')
wb=load_workbook('data.xlsx')
ws=wb.active
ws.delete_cols(1,1)
wb.save(r'c:\1\wb.xlsx') 

通过这个办法,是可以初步实现这个目的,但是中间有几个问题,待以后探讨:

  1. 合并表的目录里出现一个‘data.xlsx’的文件,就是合并后的表;
  2. 没弄明白ignore_index=False是什么意思,不论用TRUE还是False结果都是一样的;
  3. 标题列是怎么去掉的,没看出来是代码的哪段实现了这个功能。
  4. wb.save(r'c:\1\wb.xlsx') ??
  5. 不懂可以去原址学习
添加新评论