4万字《腾讯云技术实践精选集 2021》发布,点击下载 了解详情
写点什么

Airbnb 发布开源的机器学习软件包 Aerosolve

  • 2015 年 6 月 15 日
  • 本文字数:973 字

    阅读完需:约 3 分钟

Airbnb 是一个旅行房屋租赁网站,用户可以通过该网站发布、搜索度假房屋租赁信息并完成在线预定程序,它成立于 2008 年 8 月,总部设在美国加州旧金山市。Airbnb 的用户遍布 190 个国家的近 33000 个城市,发布的房屋租赁信息达到 50 多万条,被时代周刊称为“住房中的 EBay”。在 6 月 4 日举行的 OpenAir 开发者大会上,Airbnb 发布了一个为人而设计的机器学习软件包—— Aerosolve

与其他的机器学习库相比,Aerosolve 具有以下特点:

  • 特征呈现基于 thrift ,支持 Pairwise Ranking Loss 和单上下文的多条目呈现。在 Aerosolve 中,特征会按照逻辑分组,每一个组称为一个特征簇,我们可以一次性地对整个特征组进行转换,或者将两个不同的特征簇组合到一起创建新的特征簇。每一个特征向量(FeatureVector)有三种类型:stringFeatures、floatFeatures 和 denseFeatures。
  • 支持一种特征转换语言,让用户能够对特征进行更多的控制。Aerosolve 将特征转换包含在一个独立的转换模块中,与模型解耦,用户既能够将转换操作拆散使用,又可以提前转换相关数据。例如,在一个应用程序中用户可以在运行时上下文确定之前对一个文集中的条目数据进行转换和存储,然后在运行时做上下文的转换,并将转换后的上下文与提前转换的条目逐一进行联合获取最终的特征向量。常用的转换操作包括:列表转换交叉转换多尺度网格转换
  • 人类友好的调试模型。模型目录中包含很多模型,但是其中最主要的两个是:线性模型和样条模型,其他的都是试验性的模型或者是为可推理模型创建转换的子模型。
  • 独立的轻量级 Java 推理代码
  • 使用 Scala 代码进行训练
  • 简单的图片内容分析代码,适合于图片的排序或者排名。

需要注意的是,Aerosolve 适合于稀疏的、可推理的特征,例如搜索(搜索关键词、过滤词)或价格(房屋的数量、位置和价格)中通常会出现的特征;不适合非常密集的人类无法推理的特征,例如原始的像素集或者音频样本。

最后,Aerosolve 所需的制品托管在 bintray 上,如果你使用 Maven、SBT 或者 Gradle,那么需要将仓库指向 bintray 。如果想了解更多信息,可以点击这里


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者)。

2015 年 6 月 15 日 21:373215
用户头像

发布了 321 篇内容, 共 107.9 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容

区块链难在落地,亟需补人才缺口迎爬升期

CECBC

区块链

【LeetCode】K 连续位的最小翻转次数Java题解

HQ数字卡

算法 LeetCode 2月春节不断更

温故而知新!腾讯Android开发面试记录,薪资翻倍

欢喜学安卓

android 程序员 面试 移动开发

01 | Mysql基础架构

zach

MySQL

百度Hydra工具在移动端UI兼容性测试上的高效应用

百度Geek说

测试 UI

诊所数字化:诊所医护人员绩效指标评估方式

boshi

绩效 数字化转型 医疗 七日更

GitHub上爆火的Java性能优化100+小技巧!(干货建议收藏)

Java架构师迁哥

真牛皮!2021最新Android大厂面试真题大全,BAT大厂面试总结

欢喜学安卓

android 程序员 面试 移动开发

6.render阶段(厉害了,我有创建Fiber的技能)

全栈潇晨

React React Hooks react源码

翻译:《实用的Python编程》01_06_Files

codists

人工智能 后端 python 爬虫 数据结构与算法 文件操作

linux内核协议栈 邻居协议之ARP协议处理初始化

赖猫

Linux 协议栈 Linux内核

Elasticsearch Search API 基础语法

escray

elastic 七日更 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

元旦立下的Flag,春节后该如何实现?

脑极体

如何读懂CNN、BBC、经济学人、卫报、纽约时报?看完这本经典即可事半功倍!

wbliu85

学习 英语

阿里面试这样问:redis 为什么把简单的字符串设计成 SDS?

程序员内点事

Java redis 面试

十四五期间我国区块链技术趋势特征分析

CECBC

区块链 大数据

5.state更新流程(setState里到底发生了什么)

全栈潇晨

React React Hooks react源码

电信的标准化组织

Geek_古藤模根

标准化 电信

让虞书欣、李诞拍到停不下来!AR+AI双引擎的互动小游戏,如何打开IP新玩法?

爱奇艺技术产品团队

TCP 协议灵魂问题,巩固你的网路底层基础

大厂必问算法!查漏补缺LeetCode必考“1024道技术点面试题”

Java架构之路

Java 程序员 架构 面试 编程语言

腾讯云大神用这份“redis深度笔记”把Redis入门到精通全部精髓全部展现出来了

redis 架构 计算机

技术需求文档,应当这么写!

穿甲兵

需求 文档

一、MongoDB简介

Kylin

数据库 mongodb 学习 七日更 二月春节不断更

资本之外,区块链破圈正当时

CECBC

区块链

使用 Tye 辅助开发 k8s 应用竟如此简单(三)

newbe36524

Docker 微服务 k8s dotnet

探究Python源码,终于弄懂了字符串驻留技术

华为云开发者社区

Python 字符串 Python解释器 字符串驻留 字符

如何提升网页核心指标

Vincent

DPDK大页内存原理

赖猫

Linux DPDK

最新Hadoop的面试题总结

大数据老哥

地表建筑物识别Dayo1

IT蜗壳-Tango

七日更 2月春节不断更

Airbnb发布开源的机器学习软件包Aerosolve-InfoQ