AI革新工作流,你跟上了吗?效率、质量有何飞跃? 了解详情
写点什么

python批量处理

收录了 python批量处理 频道下的 50 篇内容

实用!Python大型Excel文件处理:快速导入、导出与批量处理
实用!Python 大型 Excel 文件处理:快速导入、导出与批量处理

Python 是一种功能强大的编程语言,它提供了丰富的库和工具,使得处理大型 Excel 文件变得容易和高效。下面将介绍如何使用 Python 快速导入、导出和批量处理大型 Excel 文件。

Python
Excel
Python 图像处理:批量添加水印的优雅实现与进阶技巧

在日常图像处理中,为图片添加水印是一项常见任务。有多种方法和工具可供选择,而今天我们将专注于使用Python语言结合PIL库批量添加水印。

Python
Python处理图像文件的实用姿势
Python 处理图像文件的实用姿势

Python1024自动办公系列:图像处理。 整个系列涵盖Python处理文本文件、PDF、Word、Excel、PPT、图像、音频、视频、邮件、企业办公机器人等职场办公实用场景。

Python
自动化
办公
Lambda 架构实现数据实时更新

本文是用Lambda架构来跟踪数据实时更新的项目实现。

Beam 晋升 Apache 顶级项目

Beam渡过了孵化期并成功地晋升Apache顶级项目,Google支持并贡献给开源社区整合更多的数据处理框架。

落地4年,工商银行如何进行Serverless 架构迭代
落地 4 年,工商银行如何进行 Serverless 架构迭代

重点关注服务改造成本、投产风险和预期收益。

Dropbox如何用四年完成400万行Python代码检查
Dropbox 如何用四年完成 400 万行 Python 代码检查

作为 Python 的大用户之一,Dropbox 公司内部聚集了数百万行 Python 代码,动态类型的存在让代码越来越难以理解。因此,公司开始利用 mypy 逐步将代码转换为静态类型。虽然效果得到了充分验证,但整个过程充满了各种错误和失败。本文,Dropbox 公司完整输出了从项目研究到实践的 Python 静态检查全过程,以期对各位开发者有所帮助。

Scala 更适合用于大数据处理和机器学习

对于新手来说,Scala相对比较复杂,其看起来灵活的语法并不容易掌握,但是对于熟悉Scala的用户来说,Scala是一把利器,它提供了许多独特的语言机制,可以以库的形式轻易无缝添加新的语言结构。近日,Spotify的软件工程师Neville Li发表了一篇题为《数据工程师应该学习Scala的三个理由》的文章,他认为现在的编程语言种类非常多,每种语言都各有优缺点,并且它们的适用的场景也不同,比如Scala就非常适合用于数据处理和机器学习。

主流流处理框架比较(系列文章)

分布式流处理需求日益增加,包括支付交易、社交网络、物联网(IOT)、系统监控等。业界对流处理已经有几种适用的框架来解决,下面我们来比较各流处理框架的相同点以及区别。

Gubernator开源:高性能分布式限速微服务项目
Gubernator 开源:高性能分布式限速微服务项目

近日,Mailgun将Gubernator开源,这是一个高性能的分布式限速微服务。

机器学习项目中的数据预处理与数据整理之比较

本文比较了用于数据准备的几种方法,它们分别是提取-变换-加载批处理(ETL)、流式获取和数据整理。本文还讨论了数据准备如何与可视化分析相关联,以及不同用户角色(如数据科学家或业务分析人员)应如何共同构建分析模型的最佳实践。

基于Spark的大规模推荐系统特征工程
基于 Spark 的大规模推荐系统特征工程

本次分享题目为基于Spark的大规模推荐系统特征工程及优化,主要内容包括:大规模推荐系统;Spark SQL应用与FESQL;基于LLVM的Spark优化。

为什么 Google 用 Apache Beam 彻底替换掉 MapReduce

1月10日,Apache软件基金会宣布,Apache Beam成功孵化,成为该基金会的一个新的顶级项目。谷歌坚信Apache Beam就是数据批量处理和流式处理的未来。

我是如何在AWS Lambda中用几分钟处理50万个事务的?
我是如何在 AWS Lambda 中用几分钟处理 50 万个事务的?

数据处理是一项密集型任务,尤其是对于计算单元,因为读写操作需要大量的资源。

AdMaster 技术副总裁谈 Hadoop、营销数据、Python 和挖掘平台

在本次访谈中,AdMaster技术副总裁卢亿雷谈到了营销数据的重要性、Python做数据挖掘的易用性以及他对Hadoop相关平台的看法。

Apache 两个开源项目比较:Flink vs Spark
Apache 两个开源项目比较:Flink vs Spark

比较Spark和Flink的不同

如何开发物联网应用?
如何开发物联网应用?

物联网应用是设备管理、故障监测、数据分析的重要工具。本文介绍如何基于物联网平台开发应用,包括API、SDK和图形化开发三种方式。

端智能:面向手机计算环境的端云协同 AI 技术创新
端智能:面向手机计算环境的端云协同 AI 技术创新

通过持续探索,京东零售技数中心团队创新突破了端侧高性能推理引擎、端侧模型分发、异构环境及复杂任务兼容等技术卡点,完成了多个业务应用和落地,并获得信通院边缘计算产业全景图行业认证。

快速搭建 Serverless 人脸识别离线服务
快速搭建 Serverless 人脸识别离线服务

本文介绍如何快速搭建 Serverless 人脸识别离线服务。

Amazon SageMaker 增加批量转换功能和适用于 TensorFlow 容器的管道输入模式
Amazon SageMaker 增加批量转换功能和适用于 TensorFlow 容器的管道输入模式

在几天前的纽约峰会期间,我们推出了两个新的 Amazon SageMaker 功能:一是批量转换功能,这是一种新的批量推断功能,客户可以通过它对 PB 级的数据进行非实时场景预测;二是适用于 TensorFlow 容器的管道输入模式。

python批量处理专题_资料-InfoQ中文网