Castbox:利用 Google Cloud Platform 助力用户迎接语音新时代

科技

发布于:2020 年 1 月 6 日 19:50

Castbox:利用Google Cloud Platform助力用户迎接语音新时代

在 Google Cloud Platform 与 Firebase 的有力支持之下,Castbox 得以运行起高度可扩展的语音音频内容平台,同时提供音频内搜索与精选播客推荐等一系列智能功能。

关于 Castbox

Castbox 公司创立于 2016 年,其开发的应用程序允许用户搜寻、获取以及创建语音音频内容。这款应用程序同步登陆 iOS 与 Android 平台,支持来自 175 个国家 / 地区的 5000 万播客、各种点播类广播节目以及有声读物。
所属行业:科技
所在地:中国

Google Cloud 的有力支持

  • 帮助 Castbox 提供音频内搜索功能,语音到文本的转化准确率超过 96%,查询延迟仅为 10 毫秒。
  • 允许该公司存储并分析日均增长量高达 30 GB 的数据内容。
  • 帮助该公司根据用户反馈对应用程序做出定制化调整,包括创建自有内容并支持 50000 个并发连接。

支持 50,000 个并发连接

尽管视频服务与其他消费级娱乐选项一直在不断涌现,但用户对于播客等音频播报内容的需求仍然保持强劲。Castbox 公司联合创始人李世斌认为,目前全球播客平台的快速增长主要归功于以下几个方面:速度与可用性的提升,市场驱动下的新型功能,智能设备的普及以及实际生活方式(例如驱车出行以及居家办公等不适合观看视频的日常场景)的推动。

作为一家创立于 2016 年、总部位于北京的年轻企业,Castbox 使得用户能够搜寻、获取以及创建语音音频内容。这款应用程序同步登陆 iOS 与 Android 平台,支持来自 175 个国家 / 地区的 5000 万条播客、点播类广播节目以及有声读物。该平台每天服务约 200 万用户,已经成为 Android 系统上体量最大的播客平台。

Castbox 还在核心服务之上提供一系列功能,包括精选播客推荐及音频搜索等,用以提供高质量的用户体验。

服务组合

在成立之初,Castbox 公司使用了多家跨国云服务商,以及 Google Cloud Platform 上的多种服务,其中包括 Google BigQuery 分析型数据仓库、为各类 Google Cloud 服务提供编程接口的 Cloud API 以及由 Google 移动开发平台 Firebase 提供的各项功能。

然而,随着 Castbox 业务的成熟与用户群体的不断扩大,该公司对于 Google Cloud Platform 及 Firebase 的依赖性也在随之提高。李世斌表示,“我们要求云服务始终保持稳定,我们无法容忍那些可能严重破坏用户体验的长时间停机故障。此外,我们需要在无中断前提下支持多达 50,000 个并发连接,而且这个数字在未来还将进一步提高。”

“基于对 Google BigQuery 中数据的分析,我们可以确定用户当前正在收听的内容类型、他们收听节目的时长以及具体收听时间点。如此一来,我们就可以根据这种表现出的喜好向每位用户推荐类似的播客,鼓励他们再度打开我们的平台。”
—李世斌,Castbox 公司联合创始人

差异化竞争

Castbox 公司还发现,基于机器学习的 Google Cloud Platform API 能够帮助他们实现音频内搜索等功能,从而让 Castbox 播客平台与竞争对手之间建立起明确差异。此外,Firebase SDK 与 Firebase A/B 测试也使得 Castbox 能够创建及分析新型应用,同时根据用户反馈做出调整。Firebase 实时数据库还帮助企业支撑起来自用户的成千上万个并发连接。

Google Cloud 团队一直在努力为李世斌及其团队即将推出的产品与服务提供专业技术建议,这也让 Castbox 公司下决心全面采用 Google 技术。通过与 Google 的合作,该公司得以参与多个早期体验计划,率先接触到 Google 公司的一系列早期创新成果。

音频内签名搜索服务

Castbox 公司目前正在日本东京与美国东部等区域使用 Google Cloud Platform 服务。其中 Cloud Speech-to-Text API 在帮助 Castbox 实现音频内签名搜索服务方面扮演着重要角色。该服务允许用户在平台上的音频转录结果当中搜索单词或者短语。搜索结果能够与播客标题及搜索词(例如在文本中出现的句子或者分句)语境相匹配。用户的每一次单词或短语搜索都将附有对应的时间戳,借以降低查找难度。该 API 帮助 Castbox 开发人员轻松应用神经网络算法,最终在 50 毫秒左右的搜索查询延迟之下,实现超过 96% 的音频到文本转换准确率。

另一方面,将音频转换为文本的平均延迟也仅为 250 毫秒,这意味着将长度约 12 分钟的音频转换为文本只需要 10 分钟左右。李世斌解释道,“我们能够日均处理长度约 20 个小时的音频文件,换句话说,我们可以对在此期间上线的全部播客节目进行转录与索引。”

50,000 个并发连接

凭借 Firebase 实时数据库,Castbox 现在能够在平台上支持 50,000 个并发连接,且每个连接的平均延迟低至 10 毫秒。李世斌解释道,“Firebase 实时数据库还使我们的平台能够以脱机模式保持运行,从而轻松应对随时可能出现的网络中断状况。当恢复联机之后,所有数据将重新与数据库端同步。”

Google BigQuery 与 Firebase SDK 的分析功能,则帮助 Castbox 跟踪并分析用户行为。李世斌表示,“基于对 Google BigQuery 中数据的分析,我们可以确定用户当前正在收听的内容类型、他们收听节目的时长以及具体收听时间点。如此一来,我们就可以根据这种表现出的喜好向每位用户推荐类似的播客,鼓励他们再度打开我们的平台。”

“由于我们的查询可能指向过去 40 天内的任意数据,因此单次数据分析总量可能高达 1,200 GB。但在 Google BigQuery 的有力支持下,满足这样的需求已经不再是难题。”
—李世斌,Castbox 公司联合创始人

Castbox 公司还以 Google BigQuery 提供的数据分析结果为指导,随时调整平台上的横幅通知与摘要信息,借此鼓励用户收听其他推荐内容。另外,该服务还能够以令人惊讶的准确度,为可能拥有相似品味与偏好的用户提供内容推荐。

李世斌指出,“我们拥有一套庞大的分析数据池,其日均增长量高达 30 GB。由于我们的查询可能指向过去 40 天内的任意数据,因此单次数据分析总量可能高达 1,200 GB。但在 Google BigQuery 的有力支持下,满足这样的需求已经不再是难题。”正是通过这样的分析,Castbox 公司才最终决定为其平台制作原创内容(例如财经类新闻)。

跟踪每周变更

分析用户数据,仅仅只是 Castbox 公司在提高体验质量方面做出的努力之一。该公司还汇总了来自电子邮件与 Google Play 评论的用户反馈,并每周据此对平台做出变更。接下来,他们会利用 Firebase A/B 测试以跟进用户对这些变更是否满意。

“我们对 Google Cloud Platform 以及 Firebase 感到非常满意。在内容与娱乐选项迅速爆炸的当下,我们能够借此力量与竞争对手形成差异,并为用户提供极具吸引力的产品选项。我们与 Google 拥有巨大的合作空间,未来有望进一步提高我们向用户提供的服务价值,最终建立起良好的用户参与度及忠诚度。”
—李世斌,Castbox 公司联合创始人

Castbox 对 Google Cloud Platform 的实际使用体验感到满意,因此决定进一步深化这套云平台在自身业务体系中的全面融合。李世斌表示,“我们正尝试将更多服务迁移至稳定可靠且高度可扩展的 Google Cloud Platform。”接下来,该公司计划利用 Cloud Pub/Sub 在应用程序之间建立起低延迟消息传递功能,利用 Cloud Spanner 实现分布式关系数据库服务功能,并通过 Cloud Dataflow 实现数据流与批量处理模式下的数据转换与数据丰富。

“我们对 Google Cloud Platform 以及 Firebase 感到非常满意。在内容与娱乐选项迅速爆炸的当下,我们能够借此力量与竞争对手形成差异,并为用户提供极具吸引力的产品选项。我们与 Google 拥有巨大的合作空间,未来有望进一步提高我们向用户提供的服务价值,最终建立起良好的用户参与度及忠诚度。.”

阅读数:76 发布于:2020 年 1 月 6 日 19:50

评论

发布
暂无评论