写点什么

数据科学中最好的 5 个机器学习 API

  • 2015-12-17
  • 本文字数:1862 字

    阅读完需:约 6 分钟

机器学习作为大数据的前沿无疑是让人生畏的,因为只有技术极客和数据科学领域的专家才能驾驭机器学习算法和技术,对于大部分企业和组织而言,过去这一直都是一个遥不可及的事情。但是现在这种情况正在发生改变,正如标准的 API 简化了应用程序的开发一样,机器学习 API 也降低了这一领域的门槛,让越来越多的人和企业能够借助技术底蕴深厚的公司所提供的 API 试水机器学习。

机器学习 API 隐藏了创建和部署机器学习模型的复杂性,让开发者能够专注于数据挖掘和用户体验。同时,将机器学习商业化成云服务也是当今的趋势,IBM、Microsoft、Google、Amazon 以及 BigML 等公司都为业务分析师和开发人员提供了自己的机器学习即服务(MLaaS),最近 Khushbu Shah 在 KDnuggets 上发表了一篇文章,介绍了这5 个公司的机器学习API

IBM Watson

IBM Watson Developer Cloud 于 2013 年十一月推出,它提供了一套完整的 API,简化了数据准备的流程,让开发者能够更容易地运行预测分析。作为一个认知服务,IBM Watson API 允许开发人员利用机器学习技术,如自然语言处理、计算机视觉以和预测功能,来构建更加智能的产品、服务或者应用程序,通过在应用中嵌入 IBM Watson,开发者还能够更好地理解用户是如何与应用程序交互的。

IBM Watson 是一个包含听、看、说以及理解等感知功能的扩展工具集,它提供的 API 超过了 25 个,涵盖了近 50 种技术,其中最主要的服务包括:

  • 机器翻译——帮助翻译不同语言组合中的文本
  • 消息共振——找出短语或单词在预定人群中的流行度
  • 问答——为主文档来源触发的查询提供直接的答案
  • 用户模型——根据给定的文本预测人们的社会特征

Microsoft Azure 机器学习 API

Microsoft Azure 机器学习是一个用于处理海量数据并构建预测型应用程序的平台,该平台提供的功能有自然语言处理、推荐引擎、模式识别、计算机视觉以及预测建模等,为了迎合数据科学家的喜好,Microsoft Azure 机器学习平台还增加了对 Python 的支持,用户能够直接将 Python 代码片段发布成 API。借助于 Microsoft Azure 机器学习 API,数据科学家能够更容易地构建预测模型并缩短开发周期,其主要特性包括:

  • 支持创建自定义的、可配置的 R 模块,让数据分析师或者数据科学家能够使用自己的 R 语言代码来执行训练或预测任务
  • 支持自定义的 Python 脚本,这些脚本可以使用 SciPy、SciKit-Learn、NumPy 以及 Pandas 等数据科学类库
  • 支持 PB 级的数据训练,支持 Spark 和 Hadoop 大数据处理平台

Google 预测 API

Google 预测 API 是一个云端机器学习和模式匹配工具,它能够从 BigQuery 和 Google 云存储上读取数据,能够处理销售机会分析、客户情感分析、客户流失分析、垃圾邮件检测、文档分类、购买率预测、推荐和智能路由等用户场景。使用 Google 预测 API 的用户不需要人工智能的知识,只需要有一些基础的编程背景即可。Google 预测 API 支持众多的编程语言,比如 .NET、Go、Google Web Toolkit、JavaScript、Objective C、PHP、Python、Ruby 和 Apps Script,基本覆盖了主流的编程语言。

Amazon 机器学习 API

Amazon 机器学习API 让用户不需要大量的数据专家就能够实现模型构建、数据清洗和统计分析等工作,简化了预测的实现流程。虽然该 API 有一些 UI 界面或者算法上的限制,但是却是用户友好和向导驱动的,它为开发者提供了一些可视化工具,让相关 API 的使用更直观、也更清晰。

Amazon 机器学习 API 支持的用户场景包括:

  • 通过分析信号水平特征对歌曲进行题材分类
  • 通过对智能设备加速传感器捕获的数据以及陀螺仪的信号进行分析识别用户的活动,是上楼、下楼、平躺、坐下还是站立不动
  • 通过分析用户行为预测用户是否能够成为付费用户
  • 分析网站活动记录,发现系统中的假用户、机器人以及垃圾邮件制造者

BigML

BigML 是一个对用户友好、对开发者友好的机器学习 API,该项目的动机是让预测分析对用户而言更简单也更容易理解。BigML API 提供了 3 种重要的模式:命令行接口、Web 接口和 RESTful API,其支持的主要功能包括异常检测、聚类分析、决策树的 SunBurst 可视化以及文本分析等。

借助于 BigML,用户能够通过创建一个描述性的模型来理解复杂数据中各个属性和预测属性之间的关系,能够根据过去的样本数据创建预测模型,能够在 BigML 平台上维护模型并在远程使用。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-12-17 18:005088
用户头像

发布了 321 篇内容, 共 130.2 次阅读, 收获喜欢 19 次。

关注

评论

发布
暂无评论
发现更多内容

专科逆袭!裁员后薪资翻倍,他的成功秘诀竟然是…

测吧(北京)科技有限公司

测试

基于生成式人工智能的平台 Cognizant Flowsource™ 发布,旨在为现代工程提供动力

财见

打造工业4.0的5G+边缘云服务产业生态,艾灵完成1.5亿元A轮融资

极客天地

【服务器搭建】快速完成幻兽帕鲁服务器的搭建及部署【零基础上手】

恬静的小魔龙

服务器 幻兽帕鲁

京东广告算法架构体系建设--大规模稀疏场景高性能训练方案演变

京东科技开发者

面试官:你能简单聊聊MyBatis执行流程

华为云开发者联盟

Java 开发 华为云 华为云开发者联盟

如何通过ETL实现快速同步美团订单信息

谷云科技RestCloud

美团 ETL 数据集成工具

软件公司定制开发的软件有哪些?

天津汇柏科技有限公司

软件开发定制

PingCAP 故事|势高,则围广:TiDB 的架构演进哲学

TiDB 社区干货传送门

零售业海量场景下 ToC 系统的数据库选型和迁移实践

TiDB 社区干货传送门

实践案例

Gartner 2023 API管理魔力象限发布,SmartBear被评为“远见者”

龙智—DevSecOps解决方案

Gartner SmartBear

游戏开发巨擘的选择:2023 TGA获奖工作室共同青睐Perforce版本控制

龙智—DevSecOps解决方案

游戏开发 游戏 TGA

Aetina发布首款采用NVIDIA Ada Lovelace架构的MXM图形模块

财见

作业帮 x TiDB | 多元化海量数据业务的支撑

TiDB 社区干货传送门

TiDB 事务心跳超时机制测试

TiDB 社区干货传送门

故障排查/诊断

Unity 现正式支持 visionOS 平台,赋能Apple Vision Pro应用创建

财见

用 Footprint 的交易类型标签揭秘链上交易

Footprint Analytics

区块链 加密货币

Java 程序员的待遇为何一直居高不下?

伤感汤姆布利柏

关于如何优化TiDB中的写热点问题

TiDB 社区干货传送门

实践案例 7.x 实践

WebSocket 教程:实现二进制数据传输的详细指南

Apifox

前端 后端 websocket 实时通信 二进制数据

2023年哪个前端框架用的最多?

伤感汤姆布利柏

火山引擎边缘云2023年度回顾,挑战与创新的交响乐章

火山引擎边缘云

边缘计算 火山引擎 火山引擎边缘云

TiDB 在全球头部物流企业计费管理系统的应用实践

TiDB 社区干货传送门

实践案例

为什么说TiDB在线扩容对业务几乎没有影响

TiDB 社区干货传送门

TiDB 底层架构 数据库架构选型 TiKV 底层架构

Atlassian Intelligence功能简介,AI驱动生成、概括、优化内容,助力工作效率加倍

龙智—DevSecOps解决方案

AI Atlassian

揭秘C语言的心脏:深入探索指针与数组的奥秘

不在线第一只蜗牛

Java C语言 开发语言

从 20 多套 MySQL 到 1 套 TiDB丨骏伯网络综合运营管理平台应用实践

TiDB 社区干货传送门

实践案例

深入剖析Java中的反射,由浅入深,层层剥离!

不在线第一只蜗牛

Java 编程 前端 开发语言

初识TiDB Data Migration迁移工具及实践

TiDB 社区干货传送门

迁移 7.x 实践

使用无代码/低代码平台进行开发的 5 大挑战

NocoBase

开源 低代码 低代码开发 无代码 无代码平台

数据科学中最好的5个机器学习API_大数据_孙镜涛_InfoQ精选文章