python数据分析（juypter）

最新推荐文章于 2024-06-30 14:50:24 发布

longjunj

最新推荐文章于 2024-06-30 14:50:24 发布

阅读量1.2k

点赞数 16

CC 4.0 BY-SA版权

文章标签： python 数据分析信息可视化 pycharm jupyter 数据挖掘大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62008384/article/details/139635089

数据合并
- pd.concat([df1,df2])
  - index 两个df 有相同的行索引，可以拼接起来，左右拼接, axis = 1
  - column 两个df 有相同的列名，可以拼接起来，上下拼接默认的
- pd.merge /df.merge
  - 类似于SQL的join
  - 两个df 有取值相同的列，可以通过merge 连接起来
  - how = left,right,inner outer
- df.join()
  - 默认类似于 pd.concat([df1,df2],axis = 1)
  - df.join(df2,on='列名') df的一列和df2的index值相同可以拼接起来
数据透视表，作用和分组聚合一样，只不过展示的方式有差异
数据可视化
- Matplotlib 基本套路
  - import matplotlib.pyplot as plt
  - plt.figure(figsize=()) fig,ax = plt.subplots(figsize=())
  - plt.plot()
  - plt.show()
- 直方图连续型变量，单变量看分布
  - plt.hist(bins = ) 分成几组
- 散点图两个连续型变量，看之间的关系
  - plt.scatter()
  - 气泡就是散点，只不过多了一个维度通过这个维度的数据控制点的大小
  - 蜂巢 hexbin 可以显示出不同区域数据点分布的多少
- 柱状图类别型变量，对比数量或者平均值不同从业时间平均薪资比较
  - plt.bar()
- 饼图每个部分之间对比，所有的部分相加构成一个完整的整体年底公司不同部门收入构成分析
  - plt.pie()
- 箱线图

1 数据可视化—— seaborn

需要画图的场景
- 对外要做数据分析报告，做文档，为了直观的向听众、客户、同事说明

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄4年

63
原创

1278
点赞

609
收藏

1057
粉丝

关注

私信

热门文章

上一篇：: Python数据分析中DataFrame查询数据操作

下一篇：: python中的数据分析（juypter）

最新评论

FineReport
百锦再@新空间: 这篇文章对于某个主题做出了深入的探讨，但我认为在一些关键点上还可以提供更多的支持性证据或案例，以增强文章的可信度和说服力。此外，对于某些概念的定义可以更加明确一些，以便读者更好地理解文章的核心观点。
python数据分析（juypter）
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
python数据分析（juypter）
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Python数据分析中DataFrame查询数据操作
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Mysql知识总结
征途黯然.: Mysql知识总结文章很棒，令人印象深刻。

大家在看

最新文章

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。