脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - Python数据挖掘中常用的五种AutoEDA 工具总结

Python数据挖掘中常用的五种AutoEDA 工具总结

2022-03-04 00:03Python学习与数据挖掘 Python

大家好,我们都知道在数据挖掘的过程中,数据探索性分析一直是非常耗时的一个环节,但也是绕不开的一个环节,本篇文章带你盘点数据挖掘中常见的5种 AutoEDA 工具

我们能否使用一些自动化工具代替人来完成数据分析的过程呢,现有一些成熟的 AutoEDA 工具可以一定程度上完成上述过程。

1、Pandas Profiling

https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html

Pandas Profiling是款比较成熟的工具,可以直接传入DataFrame即可完成分析过程,将结果展示为HTML格式,同时分析功能也比较强大。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、重复行分析
  • 耗时:较少

Python数据挖掘中常用的五种AutoEDA 工具总结

 

2、AutoViz

https://github.com/AutoViML/AutoViz

AutoViz是款美观的数据分析工具,在进行可视化的同时将结果保存为图片格式。

  • 功能:相关性分析、数值变量箱线图、数值变量分布图
  • 耗时:较多

Python数据挖掘中常用的五种AutoEDA 工具总结

 

3、Dataprep

https://dataprep.ai/

Dataprep是款比较灵活也比较强大的工具,也是笔者最喜欢的。它可以指定列进行分析,同时也可以在Notebook中进行交互式分析。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。
  • 耗时:较多

Python数据挖掘中常用的五种AutoEDA 工具总结

 

4、SweetViz

https://github.com/fbdesignpro/sweetviz

SweetViz是款强大的数据分析工具,可以很好的分析训练集和测试集,以及目标标签与特征之间的关系。

  • 功能:数据集对比分析、字段类型分析、变量分布分析、目标变量分析
  • 耗时:中等

Python数据挖掘中常用的五种AutoEDA 工具总结

 

5、D-Tale

https://github.com/man-group/dtale

D-Tale是款功能最为强大的数据分析工具,对单变量的分析过程支持比较好。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。
  • 耗时:中等

Python数据挖掘中常用的五种AutoEDA 工具总结

 

技术交流

欢迎转载、收藏、有所收获点赞支持一下!

Python数据挖掘中常用的五种AutoEDA 工具总结

到此这篇关于Python数据挖掘中常用的五种AutoEDA 工具总结的文章就介绍到这了,更多相关Python 数据挖掘内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/weixin_38037405/article/details/121410731

延伸 · 阅读

精彩推荐