最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

python数据清洗

收录了 python数据清洗 频道下的 50 篇内容

大话 Python:python 操作 excel 系列 -- 数据清洗
大话 Python:python 操作 excel 系列 -- 数据清洗

python 在对 excel 操作的同时,前面文章中说了数据的读取、插入、简单分析,还有一个非常重要的点就是数据清洗。那什么叫数据清洗,说白了就是去除数据文本中的垃圾值,比如:存在的空值、多余的空格、数据格式等等的处理。

Python
Excel
数据清洗
数据分析到底该怎么学?
数据分析到底该怎么学?

三步走,带你快速入门数据分析

机器学习项目中的数据预处理与数据整理之比较

本文比较了用于数据准备的几种方法,它们分别是提取-变换-加载批处理(ETL)、流式获取和数据整理。本文还讨论了数据准备如何与可视化分析相关联,以及不同用户角色(如数据科学家或业务分析人员)应如何共同构建分析模型的最佳实践。

这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表

人工智能、神经网络、机器学习、深度学习和大数据方面的重要知识点都能在这份速查表中找到!

7道常见的数据分析面试题
7 道常见的数据分析面试题

在面试数据分析时,笔试是非常重要的一个环节,它可以直接测验你对数据分析具体理论的掌握程度和动手操作的能力。以上7道来自一线大厂的数据分析面试题……

七年没能将Python 集成到 Excel,Python 之父加入微软三年后成了!
七年没能将 Python 集成到 Excel,Python 之父加入微软三年后成了!

可以实现目前人气极高的机器学习

金融高频数据管理:DolphinDB与pickle的性能对比测试和分析
金融高频数据管理:DolphinDB 与 pickle 的性能对比测试和分析

本文测试DolphinDB和pickle在数据读取方面的性能。与使用pickle文件存储相比,直接使用DolphinDB数据库,数据读取速度可最多可提升10倍以上;若为了考虑与现有Python系统的集成,使用DolphinDB提供的Python API读取数据,速度最多有2~3倍的提升。

数据分析师这个岗位,可能近几年会消亡
数据分析师这个岗位,可能近几年会消亡

近期成为月入两万的数据分析师的广告遍地都是,可能会对一些未入行的同学造成错觉。我个人感觉数据分析师这个岗位,可能近几年会消亡。未来数据分析可能会变成一个基本无门槛的模块,培养自己的产品sense,解决用户需求问题,或将成为未来的发展方向。

数据分析
数据
互联网人
AdMaster 技术副总裁谈 Hadoop、营销数据、Python 和挖掘平台

在本次访谈中,AdMaster技术副总裁卢亿雷谈到了营销数据的重要性、Python做数据挖掘的易用性以及他对Hadoop相关平台的看法。

数据中台:宜信敏捷数据中台建设实践
数据中台:宜信敏捷数据中台建设实践

本文介绍了宜信数据中台顶层设计,从中间件工具到平台及案例分析。

使用 Amazon Athena 从您的 SageMaker 笔记本运行 SQL 查询
使用 Amazon Athena 从您的 SageMaker 笔记本运行 SQL 查询

本博文将引导您完成构建数据管道所需的全部步骤—从使用 AWS Glue

2016 年数据科学家将扮演什么角色?

数据科学家被誉为2016年美国最好的工作。你想知道数据科学家的工作有什么特别之处吗?成为一名数据科学家需要掌握哪些技能?平常都会使用到什么工具?这篇文章告诉你答案。

美团 R 语言数据运营实战
美团 R 语言数据运营实战

本文来自美团点评技术文章系列。

Linkis数据中间件,打造全面连通融合的金融级大数据平台
Linkis 数据中间件,打造全面连通融合的金融级大数据平台

Linkis 是微众银行开源的一款数据中间件,用于解决前台各种工具、应用,和后台各种计算存储引擎间的连接、访问和复用问题。

PyCon 2014:机器学习应用占据 Python 的半壁江山

今年的PyCon四月9-17日在加拿大蒙特利尔召开,和其他语言的会议最不同的地方,是Python在学术界的广泛应用,这当然仰仗Python快速的原型实现能力。近来其官方网站发布了大会tutorial部分的视频和幻灯片,其中有很多(接近一半数量)跟数据挖掘和机器学习相关的内容,本文对此逐一介绍。

伴鱼数仓演进
伴鱼数仓演进

伴鱼离线数仓建立,与伴鱼的业务一起快速发展,从一条业务线,到多条业务线。在演进的过程中,有很多总结和沉淀的内容。本篇文章主要介绍伴鱼离线数据仓库的发展历史,在发展过程中遇到的各种问题,以及针对问题的解决方案。

虚拟座谈会:PyCon 嘉宾谈 Python

今年12月3日、4日,Python界著名的PyCon大会首次登陆中国,邀请了众多国内的Python高手作为嘉宾,带来了很多精彩演讲。InfoQ有幸邀请了几位与会嘉宾就广大Python爱好者所关心的问题发表了各自的观点。

数据洪流时代,企业如何释放数据价值才能步入发展“快车道”?
数据洪流时代,企业如何释放数据价值才能步入发展“快车道”?

随着数字化不断推进,全球数据量以超过 59% 的年增长率快速增长,中国的数据量增速比全球更快。其中,80% 是非结构化和半结构化数据。

途家大数据平台基于 Apache DolphinScheduler 的探索与实践
途家大数据平台基于 Apache DolphinScheduler 的探索与实践

本文介绍了途家接入 Apache DolphinScheduler 的历程,以及功能改进。

AWS数据湖十年,云计算老大哥的磨刀之路
AWS 数据湖十年,云计算老大哥的磨刀之路

数据湖的作用在未来肯定越来越重要。

python数据清洗专题_资料-InfoQ中文网