写点什么

数据科学中最好的 5 个机器学习 API

  • 2015-12-17
  • 本文字数:1862 字

    阅读完需:约 6 分钟

机器学习作为大数据的前沿无疑是让人生畏的,因为只有技术极客和数据科学领域的专家才能驾驭机器学习算法和技术,对于大部分企业和组织而言,过去这一直都是一个遥不可及的事情。但是现在这种情况正在发生改变,正如标准的 API 简化了应用程序的开发一样,机器学习 API 也降低了这一领域的门槛,让越来越多的人和企业能够借助技术底蕴深厚的公司所提供的 API 试水机器学习。

机器学习 API 隐藏了创建和部署机器学习模型的复杂性,让开发者能够专注于数据挖掘和用户体验。同时,将机器学习商业化成云服务也是当今的趋势,IBM、Microsoft、Google、Amazon 以及 BigML 等公司都为业务分析师和开发人员提供了自己的机器学习即服务(MLaaS),最近 Khushbu Shah 在 KDnuggets 上发表了一篇文章,介绍了这5 个公司的机器学习API

IBM Watson

IBM Watson Developer Cloud 于 2013 年十一月推出,它提供了一套完整的 API,简化了数据准备的流程,让开发者能够更容易地运行预测分析。作为一个认知服务,IBM Watson API 允许开发人员利用机器学习技术,如自然语言处理、计算机视觉以和预测功能,来构建更加智能的产品、服务或者应用程序,通过在应用中嵌入 IBM Watson,开发者还能够更好地理解用户是如何与应用程序交互的。

IBM Watson 是一个包含听、看、说以及理解等感知功能的扩展工具集,它提供的 API 超过了 25 个,涵盖了近 50 种技术,其中最主要的服务包括:

  • 机器翻译——帮助翻译不同语言组合中的文本
  • 消息共振——找出短语或单词在预定人群中的流行度
  • 问答——为主文档来源触发的查询提供直接的答案
  • 用户模型——根据给定的文本预测人们的社会特征

Microsoft Azure 机器学习 API

Microsoft Azure 机器学习是一个用于处理海量数据并构建预测型应用程序的平台,该平台提供的功能有自然语言处理、推荐引擎、模式识别、计算机视觉以及预测建模等,为了迎合数据科学家的喜好,Microsoft Azure 机器学习平台还增加了对 Python 的支持,用户能够直接将 Python 代码片段发布成 API。借助于 Microsoft Azure 机器学习 API,数据科学家能够更容易地构建预测模型并缩短开发周期,其主要特性包括:

  • 支持创建自定义的、可配置的 R 模块,让数据分析师或者数据科学家能够使用自己的 R 语言代码来执行训练或预测任务
  • 支持自定义的 Python 脚本,这些脚本可以使用 SciPy、SciKit-Learn、NumPy 以及 Pandas 等数据科学类库
  • 支持 PB 级的数据训练,支持 Spark 和 Hadoop 大数据处理平台

Google 预测 API

Google 预测 API 是一个云端机器学习和模式匹配工具,它能够从 BigQuery 和 Google 云存储上读取数据,能够处理销售机会分析、客户情感分析、客户流失分析、垃圾邮件检测、文档分类、购买率预测、推荐和智能路由等用户场景。使用 Google 预测 API 的用户不需要人工智能的知识,只需要有一些基础的编程背景即可。Google 预测 API 支持众多的编程语言,比如 .NET、Go、Google Web Toolkit、JavaScript、Objective C、PHP、Python、Ruby 和 Apps Script,基本覆盖了主流的编程语言。

Amazon 机器学习 API

Amazon 机器学习API 让用户不需要大量的数据专家就能够实现模型构建、数据清洗和统计分析等工作,简化了预测的实现流程。虽然该 API 有一些 UI 界面或者算法上的限制,但是却是用户友好和向导驱动的,它为开发者提供了一些可视化工具,让相关 API 的使用更直观、也更清晰。

Amazon 机器学习 API 支持的用户场景包括:

  • 通过分析信号水平特征对歌曲进行题材分类
  • 通过对智能设备加速传感器捕获的数据以及陀螺仪的信号进行分析识别用户的活动,是上楼、下楼、平躺、坐下还是站立不动
  • 通过分析用户行为预测用户是否能够成为付费用户
  • 分析网站活动记录,发现系统中的假用户、机器人以及垃圾邮件制造者

BigML

BigML 是一个对用户友好、对开发者友好的机器学习 API,该项目的动机是让预测分析对用户而言更简单也更容易理解。BigML API 提供了 3 种重要的模式:命令行接口、Web 接口和 RESTful API,其支持的主要功能包括异常检测、聚类分析、决策树的 SunBurst 可视化以及文本分析等。

借助于 BigML,用户能够通过创建一个描述性的模型来理解复杂数据中各个属性和预测属性之间的关系,能够根据过去的样本数据创建预测模型,能够在 BigML 平台上维护模型并在远程使用。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-12-17 18:004968
用户头像

发布了 321 篇内容, 共 126.6 次阅读, 收获喜欢 19 次。

关注

评论

发布
暂无评论
发现更多内容

Sam Altman 晒网友新年愿望清单;AI Pin 明年 3 月开始交付丨 RTE 开发者日报 Vol.112

声网

大数据技术探索:学习、应用与未来趋势

啊川..

C 语言教程:条件和 if...else 语句

小万哥

程序人生 编程语言 软件工程 C/C++ 后端开发

技术人的 2023 总结:人工智能-基于机器学习的环境污染影响评估学习

恒山其若陋兮

#技术人的2023总结

我在平台与AIGC的交互的组件设计方案(2)

大东(AIP内容运营专员)

如何用零代码工具去经营好企业的客户

明道云

提升用户体验--了解和探索无障碍性测试

QE_LAB

无障碍 测试技术

Databend 开源周报第 125 期

Databend

OpenAI换血大震动始末:“ChatGPT之父”奥特曼,缘何被“扫地出门”?

芯动大师

WuBit:聚合BRC20资产交易,续写铭文市场新浪潮

石头财经

基于大语言模型LangChain框架:知识库问答系统实践

博文视点Broadview

拼多多商品ID取商品详情API:电商行业核心价值及实时数据采集

tbapi

拼多多API接口 拼多多商品详情数据接口 拼多多数据接口

浙江电信基于 Amoro + Apache Iceberg 构建实时湖仓实践

Amoro Community

Apache iceberg 湖仓一体 大数据 开源 电信运营商

图形工作站跟服务器有什么区别?

青椒云云电脑

图形工作站

企业云桌面解决方案

青椒云云电脑

云桌面 云桌面解决方案

WuBit:聚合BRC20资产交易,续写铭文市场新浪潮

BlockChain先知

Nacos 荣获 GLCC 优秀社区,同时 2.3.0-BETA 发布,欢迎试用

阿里巴巴云原生

阿里云 云原生 nacos

中国科学事业的长河上,升起一道曙光

脑极体

AI 算力

软件测试/测试开发|常见软件测试框架类型:TDD、BDD、DDD、ATDD、DevOps介绍

霍格沃兹测试开发学社

连锁餐饮数字化:一体化运营管控平台

明道云

Ampere 年度展望:AI 浪潮改变计算格局,预测 2024 年三大趋势

科技热闻

E3PO:畅想 360° 视频传输开发实战

恒山其若陋兮

E3PO 畅想 360° 视频传输

低代码实施复杂应用的实践方法

明道云

ATorch:蚂蚁开源PyTorch分布式训练扩展库,助你将硬件算力压榨到极致

AI Infra

人工智能 aiinfra

2023年度系列榜单出炉 这些优质应用你都用过多少?

最新动态

软件测试/测试开发|如何定位bug,一篇文章告诉你

霍格沃兹测试开发学社

Go 1.22新特性前瞻

Tony Bai

golang Go 语言 go1.22

极狐GitLab 集成 sonarqube 实践指南

极狐GitLab

绝地反击,不做背锅侠!

尚思卓越

运维 堡垒机

数据科学中最好的5个机器学习API_大数据_孙镜涛_InfoQ精选文章