📊 Pandas 分组占比 | 📊 Pandas中分组统计的占比计算

导读 数据分析时,我们常常需要对数据进行分组并计算占比,这不仅能帮助我们更直观地理解数据分布,还能为决策提供有力支持。今天就来聊聊如何用...

数据分析时,我们常常需要对数据进行分组并计算占比,这不仅能帮助我们更直观地理解数据分布,还能为决策提供有力支持。今天就来聊聊如何用Pandas实现这一功能!

首先,确保你的数据已经加载到DataFrame中,比如 `df`。假设你有一个包含销售数据的表格,其中有一列是地区(Region),另一列是销售额(Sales)。如果你想知道每个地区的销售额占总销售额的比例,可以这样做:

```python

计算每个地区的销售额占比

df['Sales_Ratio'] = df.groupby('Region')['Sales'].transform(lambda x: x / x.sum())

```

这样,每一行都会新增一列 `Sales_Ratio`,表示该行对应的销售额占该地区总销售额的比例。如果想进一步简化结果,只展示各地区的占比,可以直接使用 `groupby` 和 `agg` 方法:

```python

region_ratio = df.groupby('Region')['Sales'].sum().reset_index(name='Total_Sales')

region_ratio['Ratio'] = region_ratio['Total_Sales'] / region_ratio['Total_Sales'].sum()

print(region_ratio)

```

这种方法不仅高效,还能灵活适应各种复杂场景!✨

快试试吧,让数据为你说话!💪

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章