pandas读取excel数据修改格式

作者：excel百科网

242人看过

发布时间：2026-01-23 07:21:40

标签：

pandas读取Excel数据并修改格式的实战指南在数据处理和分析中，Excel是一个常用的格式化工具，而Python中的pandas库则提供了强大的数据处理能力。pandas能够高效地读取Excel文件，并支持对数据进行格式化和修改

pandas读取Excel数据并修改格式的实战指南
在数据处理和分析中，Excel是一个常用的格式化工具，而Python中的pandas库则提供了强大的数据处理能力。pandas能够高效地读取Excel文件，并支持对数据进行格式化和修改。本文将详细介绍如何使用pandas读取Excel数据并进行格式调整，帮助读者在实际工作中灵活应用这一技术。
一、pandas读取Excel数据的基本方法
pandas读取Excel数据的核心方法是`pd.read_excel()`，它支持多种文件格式，包括.xlsx和.xls。该函数可以读取单个工作表或多个工作表，并支持不同的读取选项，例如`sheet_name`、`header`、`skiprows`等。
1.1 读取单个工作表
python
import pandas as pd
读取指定路径的Excel文件
df = pd.read_excel("data.xlsx", sheet_name="Sheet1")
print(df.head())

这段代码会读取名为“Sheet1”的工作表，并打印前5行数据。如果文件中没有指定工作表，`sheet_name`默认为0，即第一个工作表。
1.2 读取多个工作表
python
读取多个工作表
dfs = pd.read_excel("data.xlsx", sheet_name=["Sheet1", "Sheet2", "Sheet3"])

这里通过`sheet_name`参数传递列表，可以读取多个工作表，并将它们存储为一个字典形式的列表。
1.3 读取特定行或列
python
读取前3行
df = pd.read_excel("data.xlsx", sheet_name="Sheet1", nrows=3)
读取第2列
df = pd.read_excel("data.xlsx", sheet_name="Sheet1", usecols="B")

通过`nrows`和`usecols`参数，可以灵活控制读取的数据范围，提升数据处理的效率。
二、Excel文件格式的处理与修改
在读取数据后，往往需要对Excel文件的格式进行调整，以适应后续的数据分析或导出需求。pandas提供了多种方法来修改Excel文件的格式。
2.1 修改Excel文件的格式
pandas本身不提供直接修改Excel文件的功能，但可以通过`to_excel()`方法将数据写回Excel文件。该方法支持多种格式调整选项，如`index`、`header`、`columns`等。
python
将数据写入Excel文件，修改格式
df.to_excel("output.xlsx", index=False, header=False, columns=["A", "B"])

此代码会将数据写入名为“output.xlsx”的文件，且不包含索引和表头，只保留列A和B。
2.2 修改Excel文件的列名
在读取数据后，若需要修改列名，可以通过`columns`参数进行调整：
python
修改列名
df = pd.read_excel("data.xlsx", sheet_name="Sheet1", columns=["A", "B", "C"])

此代码会将原表中的列A、B、C作为新的列名保存。
2.3 修改Excel文件的格式样式
pandas本身不支持直接修改Excel文件的样式，但可以通过`ExcelWriter`类创建新的Excel文件，并在写入时设置格式。例如，可以使用`openpyxl`库来设置单元格格式。
python
from openpyxl import Workbook
创建新的Excel文件并设置格式
wb = Workbook()
ws = wb.active
设置单元格格式
ws["A1"].fill = openpyxl.styles.PatternFill("solid", fill_color="00FF00")
ws["A1"].font = openpyxl.styles.Font(color="0000FF")
写入数据
df.to_excel(wb, index=False, sheet_name="Sheet1")

这段代码创建了一个新的Excel文件，并在A1单元格上设置了填充颜色和字体样式。
三、数据清洗与格式调整
在读取和修改Excel文件之后，数据清洗和格式调整是必不可少的步骤。pandas提供了丰富的数据处理方法，帮助用户完成这些任务。
3.1 处理缺失值
在读取数据时，可能会出现缺失值，可以通过`dropna()`或`fillna()`方法进行处理。
python
删除缺失值
df = df.dropna()
填充缺失值
df = df.fillna(0)

这些方法可以有效处理数据中的空值，提升数据的完整性和可用性。
3.2 数据类型转换
pandas支持对数据类型进行转换，例如将字符串转换为整数。
python
将字符串转换为整数
df["A"] = df["A"].astype(int)

此代码将列A的数据类型转换为整数，适用于需要整数计算的场景。
3.3 数据重命名与合并
在处理多个Excel文件时，可能需要将多个文件的数据合并，或者对列名进行重命名。
python
合并多个Excel文件
dfs = pd.read_excel("data.xlsx", sheet_name=["Sheet1", "Sheet2", "Sheet3"])
combined_df = pd.concat(dfs, ignore_index=True)
重命名列名
combined_df.rename(columns="A": "New_A", "B": "New_B", inplace=True)

这些方法提高了数据处理的灵活性和效率。
四、实际应用场景与案例分析
在实际工作中，pandas读取Excel数据并进行格式调整的应用非常广泛，包括数据分析、报表生成、数据可视化等场景。
4.1 数据分析
在数据分析中，pandas可以读取Excel文件，进行数据清洗、统计分析和可视化。
python
import matplotlib.pyplot as plt
统计数据
mean_values = df.describe().loc["mean"]
绘制柱状图
plt.bar(mean_values.index, mean_values.values)
plt.title("Mean Values")
plt.show()

这段代码可以快速生成数据的统计图表，帮助用户直观了解数据分布。
4.2 报表生成
在生成报表时，pandas可以将数据写入Excel文件，并设置格式，以便于打印或导出。
python
df.to_excel("report.xlsx", index=False, header=False)

此代码将数据写入名为“report.xlsx”的文件，格式整洁，适合作为报表使用。
五、总结与建议
pandas是一种功能强大、易用的数据处理工具，能够高效地读取和修改Excel文件。在实际应用中，根据具体需求选择合适的读取方式和格式调整方法，可以显著提升数据处理的效率和准确性。
在使用pandas读取Excel数据时，应关注以下几点：
- 选择合适的读取方式：根据数据量和格式选择`read_excel()`或`read_csv()`。
- 处理缺失值：使用`dropna()`或`fillna()`方法处理数据中的空值。
- 数据类型转换：根据需求将数据类型转换为整数、浮点数等。
- 格式调整：使用`to_excel()`方法设置文件格式，确保输出符合要求。
- 数据清洗与合并：通过`dropna()`、`fillna()`、`rename()`等方法进行数据清洗和合并。
在实际工作中，建议结合具体项目需求，灵活运用pandas的功能，提升数据处理的效率和质量。
六、扩展学习与资源推荐
对于想要深入学习pandas的用户，推荐以下资源：
1. 官方文档：[https://pandas.pydata.org/pandas-docs/stable/](https://pandas.pydata.org/pandas-docs/stable/)
2. 教程与书籍：《Python数据分析与可视化》、《Pandas实战》等。
3. 社区与论坛：Stack Overflow、GitHub、知乎等平台，提供丰富的学习资源和案例。
通过系统学习和实践，可以全面掌握pandas的使用技巧，提升数据处理的能力。

上一篇 : excel数据透视表出入库

下一篇 : 将matlab数据保存到excel