在数据分析中,`pandas` 是一款强大的工具,而 `DataFrame` 的合并操作更是常用功能之一。如果两个 `DataFrame` 有相同的列名,我们该如何优雅地合并它们呢?以下是几种常见的合并方式👇:
方法一:`pd.concat()`
这是最常用的合并方法,适用于按行或列拼接数据。例如,当两个 `DataFrame` 的索引不冲突时,可以简单地用 `axis=0`(纵向拼接)或 `axis=1`(横向拼接)。
```python
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})
result = pd.concat([df1, df2], axis=0)
```
方法二:`merge()`
当需要基于某一列进行关联时,`merge()` 是更好的选择。它支持内连接、外连接等多种模式,默认为内连接。
```python
result = pd.merge(df1, df2, on='A', how='outer')
```
方法三:`join()`
对于索引对齐的需求,`join()` 是理想之选。例如,将两个 `DataFrame` 按索引合并。
```python
result = df1.join(df2, lsuffix='_left', rsuffix='_right')
```
无论使用哪种方法,合理处理相同列名问题都至关重要。掌握这些技巧,数据分析将更加得心应手!💪