

 写点什么

登录/注册

python批量处理

收录了 python批量处理频道下的 50 篇内容

实用！Python大型Excel文件处理：快速导入、导出与批量处理

实用！Python 大型 Excel 文件处理：快速导入、导出与批量处理

Python 是一种功能强大的编程语言，它提供了丰富的库和工具，使得处理大型 Excel 文件变得容易和高效。下面将介绍如何使用 Python 快速导入、导出和批量处理大型 Excel 文件。

Python

Excel

树上有只程序猿

2023-09-21

0

Python 图像处理：批量添加水印的优雅实现与进阶技巧

在日常图像处理中，为图片添加水印是一项常见任务。有多种方法和工具可供选择，而今天我们将专注于使用Python语言结合PIL库批量添加水印。

Python

2023-12-24

0

Python处理图像文件的实用姿势

Python 处理图像文件的实用姿势

Python1024自动办公系列：图像处理。整个系列涵盖Python处理文本文件、PDF、Word、Excel、PPT、图像、音频、视频、邮件、企业办公机器人等职场办公实用场景。

Python

自动化

办公

2020-08-24

0

Lambda 架构实现数据实时更新

本文是用Lambda架构来跟踪数据实时更新的项目实现。

作者 : 侠天

2016-04-12

4464

Beam 晋升 Apache 顶级项目

Beam渡过了孵化期并成功地晋升Apache顶级项目，Google支持并贡献给开源社区整合更多的数据处理框架。

作者 : Dylan Raithel 译者: 麦克周

2017-02-26

2355

落地4年，工商银行如何进行Serverless 架构迭代

落地 4 年，工商银行如何进行 Serverless 架构迭代

重点关注服务改造成本、投产风险和预期收益。

作者 : 工行金融科技研究院云计算实验室策划: 褚杏娟

2023-03-27

0

Dropbox如何用四年完成400万行Python代码检查

Dropbox 如何用四年完成 400 万行 Python 代码检查

作为 Python 的大用户之一，Dropbox 公司内部聚集了数百万行 Python 代码，动态类型的存在让代码越来越难以理解。因此，公司开始利用 mypy 逐步将代码转换为静态类型。虽然效果得到了充分验证，但整个过程充满了各种错误和失败。本文，Dropbox 公司完整输出了从项目研究到实践的 Python 静态检查全过程，以期对各位开发者有所帮助。

作者 : Jukka Lehtosalo 译者: 核子可乐策划: 赵钰莹

2019-09-18

1840

Scala 更适合用于大数据处理和机器学习

对于新手来说，Scala相对比较复杂，其看起来灵活的语法并不容易掌握，但是对于熟悉Scala的用户来说，Scala是一把利器，它提供了许多独特的语言机制，可以以库的形式轻易无缝添加新的语言结构。近日，Spotify的软件工程师Neville Li发表了一篇题为《数据工程师应该学习Scala的三个理由》的文章，他认为现在的编程语言种类非常多，每种语言都各有优缺点，并且它们的适用的场景也不同，比如Scala就非常适合用于数据处理和机器学习。

作者 : 小盖

2014-10-20

9757

主流流处理框架比较（系列文章）

分布式流处理需求日益增加，包括支付交易、社交网络、物联网（IOT）、系统监控等。业界对流处理已经有几种适用的框架来解决，下面我们来比较各流处理框架的相同点以及区别。

作者 : Petr Zapletal 译者: 侠天

2016-07-07

11877

Gubernator开源：高性能分布式限速微服务项目

Gubernator 开源：高性能分布式限速微服务项目

近日，Mailgun将Gubernator开源，这是一个高性能的分布式限速微服务。

作者 : Mailgun 译者: 红泥

2019-08-06

2846

机器学习项目中的数据预处理与数据整理之比较

本文比较了用于数据准备的几种方法，它们分别是提取-变换-加载批处理（ETL）、流式获取和数据整理。本文还讨论了数据准备如何与可视化分析相关联，以及不同用户角色（如数据科学家或业务分析人员）应如何共同构建分析模型的最佳实践。

作者 : Kai Wähner 译者: 谢旭

2017-04-26

8704

基于Spark的大规模推荐系统特征工程

基于 Spark 的大规模推荐系统特征工程

本次分享题目为基于Spark的大规模推荐系统特征工程及优化，主要内容包括：大规模推荐系统；Spark SQL应用与FESQL；基于LLVM的Spark优化。

作者 : DataFunTalk

2020-09-07

0

为什么 Google 用 Apache Beam 彻底替换掉 MapReduce

1月10日，Apache软件基金会宣布，Apache Beam成功孵化，成为该基金会的一个新的顶级项目。谷歌坚信Apache Beam就是数据批量处理和流式处理的未来。

作者 : 足下

2017-02-09

11979

我是如何在AWS Lambda中用几分钟处理50万个事务的？

我是如何在 AWS Lambda 中用几分钟处理 50 万个事务的？

数据处理是一项密集型任务，尤其是对于计算单元，因为读写操作需要大量的资源。

作者 : Mohammed Lutfalla 译者: Sambodhi 策划: 凌敏

2021-07-26

0

AdMaster 技术副总裁谈 Hadoop、营销数据、Python 和挖掘平台

在本次访谈中，AdMaster技术副总裁卢亿雷谈到了营销数据的重要性、Python做数据挖掘的易用性以及他对Hadoop相关平台的看法。

作者 : 张天雷

2014-09-25

2907

Apache 两个开源项目比较：Flink vs Spark

Apache 两个开源项目比较：Flink vs Spark

比较Spark和Flink的不同

作者 : 黄浴策划: 刘燕

2019-08-18

8968

如何开发物联网应用？

如何开发物联网应用？

物联网应用是设备管理、故障监测、数据分析的重要工具。本文介绍如何基于物联网平台开发应用，包括API、SDK和图形化开发三种方式。

作者 : 华为IoT云服务

2019-11-05

233

端智能：面向手机计算环境的端云协同 AI 技术创新

端智能：面向手机计算环境的端云协同 AI 技术创新

通过持续探索，京东零售技数中心团队创新突破了端侧高性能推理引擎、端侧模型分发、异构环境及复杂任务兼容等技术卡点，完成了多个业务应用和落地，并获得信通院边缘计算产业全景图行业认证。

京东零售技术

2024-03-01

0

快速搭建 Serverless 人脸识别离线服务

快速搭建 Serverless 人脸识别离线服务

本文介绍如何快速搭建 Serverless 人脸识别离线服务。

作者 : 阿里云容器平台

2020-01-19

2269

Amazon SageMaker 增加批量转换功能和适用于 TensorFlow 容器的管道输入模式

Amazon SageMaker 增加批量转换功能和适用于 TensorFlow 容器的管道输入模式

在几天前的纽约峰会期间，我们推出了两个新的 Amazon SageMaker 功能：一是批量转换功能，这是一种新的批量推断功能，客户可以通过它对 PB 级的数据进行非实时场景预测；二是适用于 TensorFlow 容器的管道输入模式。

作者 : 亚马逊云科技 (Amazon Web Services）

2019-10-22

49