程序如此灵动~
  • 关于
  • 产品运营
  • 运维测试
    • Docker
    • Nginx
    • Centos
    • Mac
    • tomcat
  • 前端编程
    • react
    • vue
    • 小程序
    • webpack
    • redux
    • HTML
  • 后端编程
    • php
    • node
    • java
    • rust
  • 移动开发
  • 数据分析
    • python
    • R
    • 知识图谱
    • GraphQL
    • 加密解密
    • MySQL
    • 机器学习
    • LDAP
    • 大模型
  • 客户端开发
    • Electron
    • GIS开发
    • cpp
  • 游戏开发
  • 首页
苏南大叔 » 程序如此灵动~

数据清洗,如何处理完全重复或部分重复的数据?

发布于2024年09月25日
python
上一篇文章中,苏南大叔所描述的例子,侧重于字段名重复,而并不是关心对应字段的数据。而本篇文章中,则更加关注于数据本身。即横向的一条数据,用于描述某个个体特征的一条数据。如果两条(甚至多条)数据重复。该如何处理数据呢...
阅读更多

数据清洗,如何处理DataFrame的重复列名数据?

发布于2024年09月24日
python
为了保持数据的整洁和合理,有必要对拿到的数据集进行整理。其中首当其冲的就是重复数据,重复的数据分为两种情况,分别是重复列和重复行。本文就第一种情况,重复列的情况进行阐述。苏南大叔的“程序如此灵动”博客,记录苏南大叔...
阅读更多

以泰坦尼克号数据集为例,如何统计每个字段的非na值数量?

发布于2024年09月23日
python
实际工作中遇到的数据集都会存在着多多少少的不完美数据,即空值na数据。面对这些不完美数据,在做进一步的处理之前。还应该有个大体的空值数量的了解和认知。本文就是对这一点进行讨论的。苏南大叔的"程序如此灵动"博客,记录...
阅读更多

以泰坦尼克数据集为例,探讨空值检测手段isna()和isnull()

发布于2024年09月22日
python
话题回到泰坦尼克数据集,本文以该数据集为例,探讨对数据进行清洗处理中空值检测的几种方式。因为在数据清洗的领域里面,空值是一定影响数据预测的结果的,一定要提前预防。苏南大叔的“程序如此灵动”博客,记录苏南大叔的代码经...
阅读更多

数据清洗,如何理解groupby的as_index参数?

发布于2024年09月21日
python
对dataframe数据进行分组的时候,有个as_index参数。本文对这个参数进行一下简要的讨论,根据官方文档的说法,这个参数的最大的作用是控制数据输出的风格。苏南大叔的“程序如此灵动”博客,记录苏南大叔的编程经...
阅读更多
  1. «
  2. 1
  3. ...
  4. 43
  5. 44
  6. 45
  7. 46
  8. 47
  9. 48
  10. 49
  11. 50
  12. 51
  13. 52
  14. 53
  15. 54
  16. 55
  17. 56
  18. 57
  19. 58
  20. 59
  21. 60
  22. 61
  23. 62
  24. 63
  25. ...
  26. 444
  27. »
sunan

眼观六路耳听八方,热心市民苏南大叔

sunan

sunan(at)pku.edu.cn

苏南,一名有着远大理想的互联网从业者。
技术顾问,项目经理,PMP持证人,北大校友

标签云
  • python
  • php
  • electron
  • react
  • js
  • mac
  • node
  • css
  • mysql
  • webpack
  • centos
  • nginx
  • neo4j
  • docker
  • vscode
  • sklearn
  • npm
  • chrome
  • java
  • redis
  • win10
  • redux
  • 宝塔面板
  • brew
  • thinkphp
  • piwik
  • 百度
  • qgis
  • jquery
  • apache
  • github
  • pip
  • elastic
  • seo
  • android
  • 机器学习
可能喜欢
  • 以泰坦尼克数据集为例,探讨空值检测手段isna()和isnull()
  • Cheat Engine修改器,如何使用指针扫描器?
  • 如何新建一个php的phar打包文件?
  • 苹果系统,如何计算一个文件的md5值?用于文件比较
  • nginx及apache代理pm2启动的node程序
  • sass 编译,如何解决错误 Invalid GBK character "\xE8"
最新文章
  • 如何理解和启用brotil压缩?和gzip类似的brotil压缩
  • 通过deepseek查找菜谱数据集下载地址,大模型幻觉现象
  • 苹果系统不能联网,能打开QQ,却无法浏览网页
  • Dify大模型,知识库解析父子分段模式,召回率提升
  • Dify大模型,如何理解知识库recall召回率?知识库评价
  • Dify大模型,如何使用知识库数据?向量数据库weaviate

© 2025 程序如此灵动~.  

Email:sunan@pku.edu.cn

(English/中文/Français/Español/한국어/にほんご)

检测到了复制动作,那么是否解决了您的问题?

原创不易,转载请保留链接,谢绝镜像采集
如果能解决您的困扰,那么想必定是极好的
快来这里!大家都在这儿等你讨论这个问题
解决了,打赏一下    木解决,讨论一下