Pandas中的 transform()结合 groupby()用法示例详解_Python

Pandas中的 transform()结合 groupby()用法示例详解

2022-01-03 15:15cnhwl Python

这篇文章主要介绍了Pandas中的 transform() 结合 groupby() 用法示例,本文通过一个餐厅数据集给大家分享解决方案，示例代码简单易懂，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友参考下吧

首先，假设我们有如下餐厅数据集：

import pandas as pd

df = pd.DataFrame({
'restaurant_id': [101,102,103,104,105,106,107],
'address': ['A','B','C','D', 'E', 'F', 'G'],
'city': ['London','London','London','Oxford','Oxford', 'Durham', 'Durham'],
'sales': [10,500,48,12,21,22,14]
})

Pandas中的 transform()结合 groupby()用法示例详解

如果我们想知道：每个餐厅在城市中所占的销售额百分比是多少？预期得到的输出是：

Pandas中的 transform()结合 groupby()用法示例详解

相比于原来的数据集，多了两列，分别是某个城市所有餐厅的销售总额，以及每个餐厅在城市中所占的销售额百分比。解决方案有两个：

方案一（较麻烦）：

1、使用 groupby('city') 基于城市进行分组，对于这些组中的每一个组，选中其销售额列 ['sales']，然后使用函数 apply(sum) 或者sum() 对城市的销售额进行求和。

之后，新列被重命名为 city_total_sales 并且索引被重置（注意不能漏了 reset_index() ，因为 groupby('city') 生成的索引是城市，而我们希望城市作为普通列）。

city_sales = df.groupby('city')['sales']
           .sum().rename('city_total_sales').reset_index()

得到的 city_sales 如下：

Pandas中的 transform()结合 groupby()用法示例详解

2、用 merge() 函数把 city_sales 合并回去，得到的 df_new 如下：

df_new = pd.merge(df, city_sales, how='left')

Pandas中的 transform()结合 groupby()用法示例详解
3、最后，求百分比并保留两位小数，结果如下：

df_new['pct'] = df_new['sales'] / df_new['city_total_sales']
df_new['pct'] = df_new['pct'].apply(lambda x: format(x, '.2%'))

Pandas中的 transform()结合 groupby()用法示例详解

方案二（便捷）：

1、
transform() 函数在执行转换后保留与原始数据集相同数量的项目。因此，使用 groupby() 然后使用 transform(sum) 会返回相同的输出，结果如下图：

df['city_total_sales'] = df.groupby('city')['sales']
                         .transform('sum')

代码翻译过来就是：数据集基于城市进行分组，然后选定销售额列，对每组的销售额进行求和，返回一个和原列长度一样的新列。

Pandas中的 transform()结合 groupby()用法示例详解

2、

与方案一相同。

df['pct'] = df['sales'] / df['city_total_sales']
df['pct'] = df['pct'].apply(lambda x: format(x, '.2%'))

总结：可以看出，在对 DataFrame 进行分组 groupby() 之后，如果是使用 apply() 或者直接使用某个统计函数，得到的新列的长度与分组得到的组数是一样的；而如果使用 transform() ，得到的新列与 DataFrame 中列的长度是一样的。

到此这篇关于Pandas中的 transform()结合 groupby()用法示例详解的文章就介绍到这了,更多相关Pandas groupby() 用法内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家！

原文链接：https://blog.csdn.net/cnhwl/article/details/120169278

Pandas中的 transform()结合 groupby()用法示例详解

方案一（较麻烦）：

方案二（便捷）：

延伸 · 阅读

python 列表转为字典的两个小方法(小结)

Python的dict字典结构操作方法学习笔记

python 插入Null值数据到Postgresql的操作

python直接访问私有属性的简单方法

Python实现ping指定IP的示例

使用NumPy和pandas对CSV文件进行写操作的实例

在Windows系统上搭建Nginx+Python+MySQL环境的教程

Python3以GitHub为例来实现模拟登录和爬取的实例讲解

PyCharm设置SSH远程调试的方法

Python安装图文教程 Pycharm安装教程

python是什么意思？python有什么用？

使用Python抓取模板之家的CSS模板

Python 列表(List)操作方法详解