写点什么

云搜索服务给你的不仅仅是 Elasticsearch

  • 2020-03-27
  • 本文字数:1149 字

    阅读完需:约 4 分钟

云搜索服务给你的不仅仅是Elasticsearch

云搜索服务在不同场景下的技术能力主要体现在四个方面:



  • 站内搜索场景的智能化增强


在网站、APP、对话机器人等众多站内搜索场景中,经常会碰到两类问题导致搜索不准确。


一类是分词。比如新词或特有名词无法搜索、短语查询不准确、词库无法支持多租户等等。针对这些场景,华为将自研分词器嵌入云搜索服务中,为用户提供新词或者特有名词识别、英文短语支持、索引级别自定义词库等众多功能。


另一类是搜索结果排序。在 ES 中做搜索定制排序规则时,都是静态的,比如制定各个字段的权重,打分的算法等。但是在现实场景中,用户往往不是按照我们的打分规则来评判自己想要的东西。针对这些场景,云搜索服务可以根据用户点击历史数据训练模型进行重排序,达到越搜越准的效果。


  • 多媒体检索场景的多元化延伸


在多媒体搜索场景中,最通常的就是通过图片的描述进行搜索,但是这种方式很有局限性,搜索的结果完全取决于描述的正确性以及搜索语句是否合适。云搜索服务在开源的 ES 基础之上,增强了对图片特征向量检索相关技术的支持,实现了以图搜图,以及图片与文本的协同搜索。有了对图片搜索的支持,云搜索服务把 ES 扩展到了图片版权查询、手机拍照查询等更多的应用场景中。


音频检索中,如何用音频片段在大量音频内容高效的找到匹配的音频,是传统方法面临的难题。云搜索服务结合全文检索技术,将音频指纹检索利用倒排索引加速,很好地解决了音频检索的性能问题。


  • 日志分析场景的便捷化扩展


在日志分析场景中,如何有效进行日志分析成为一个难题。总体而言,包括以下四个方面:日志分散,分析困难,容量有限和速度受制。云搜索服务利用云上优势,和数据接入、实时流计算、云数据迁移等服务打通,用户无需编程就可以搭建一套完整的日志解决方案。


同时,云搜索服务还给 ES 添加了更多的算子,比如 Last Hit,满足了用户更多的统计分析需求。


  • 云端运维能力的专业化积累


云服务在生产环境中必须要能长期、稳定、可靠的运行,这离不开运维系统和运维团队的保障。云搜索服务一键式的部署和扩容功能、自动备份机制、开放的 API 和可配置的监控告警平台,让用户从运维中解放出来。运维团队也构筑了 SRE 能力,从研发、基础设施、运营、运维等多个层次展开,并 7*24 小时 oncall 守护用户的服务稳定运行。


云搜索服务在对外提供服务的同时,也在为自己的服务提供着运维支撑。其利用 filebeat+logstash 收集管理面和业务面的日志,实现日志的可视化分析;收集数据库运维数据和用户 ES 集群的监控数据,做实时的监控和告警,让运维人员先于客户发现问题。这种自己的产品自己应用的方式,不仅检验了云搜索服务的稳定性,也在产品使用上积累了丰富的经验,从而为用户使用云搜索服务提供了更好的保障。


本文转载自华为云产品与解决方案公众号。


原文链接:https://mp.weixin.qq.com/s/UZZLmLPnhGADAYWsgu5gIw


2020-03-27 22:19892

评论

发布
暂无评论
发现更多内容

面试官:请讲一下Redis主从复制的功能及实现原理

华为云开发者联盟

redis 数据 节点 redis哨兵 主从复制

统一数据管理工具——CloudQuery v1.3.3 上线!

BinTools图尔兹

数据库 运维 开发工具 dba 数据库管理工具

如何快速上手 angular.js

华为云开发者联盟

html Vue 数据 angular js

短信验证码被刷怎么办?java 短信验证码防刷策略分析

香芋味的猫丶

黑客 短信防刷 短信验证码 短信防轰炸 短信防火墙

民进昆明市委:建议利用区块链技术优势在昆明打造金融应用平台

CECBC

金融 金融区块链

淘宝的商品中心和类目体系是怎么设计的

邴越

架构 阿里 模型 电商 业务

【JS】异常处理

德育处主任

JavaScript 大前端 js 28天写作 2月春节不断更

速看!教育上云 让学习战“疫”两不误

教育云

一周信创舆情观察(1.25~1.31)

统小信uos

5步教你将MRS数据导入DWS

华为云开发者联盟

数据 MRS GaussDB 集群 DWS

区块链+电力,又擦出什么新火花?

CECBC

区块链

探索语言交互技术在政务数字化的应用

华为云开发者联盟

语音 政务 语言交互 VUI G2c

为您收录的操作系统系列 - 进程管理(中篇)

鲁米

操作系统 进程 同步

Spark Shuffle 内部机制(一)

hanke

大数据 spark 开源

RocketMQ-Spring 毕业两周年,为什么能成为 Spring 生态中最受欢迎的 messaging 实现?

阿里巴巴云原生

Docker 容器 微服务 云原生 API

信任从对自己诚实开始

Justin

心理学 信任 28天写作

程序员成长第三篇:好的代码和好的工程师

石云升

28天写作 2月春节不断更 工程师等级

区块链终将彻底改变医疗行业,但哪些因素制约当前的采用?

CECBC

区块链

以终为始:28天打卡输出复盘

熊斌

个人成长 写作平台 28天写作

口碑销量双爆的数据分析丛书再添新成员!

博文视点Broadview

Elasticsearch+Fluentd+Kafka搭建日志系统

远鹏

kafka ELK EFK Fluentd 日志系统

GrowingIO SaaS 产品 CI/CD 实践 (一)

GrowingIO技术专栏

ci SaaS CD

2021年 区块链最火的app爱打卡

v16629866266

互助系统软件开发,互助app开发

luluhulian

Kubernetes安装篇(下):基于Kubeadm方式的集群部署

xcbeyond

Kubernetes kubeadm 部署 28天写作 Kubernetes从入门到精通

Kafka架构介绍

架构精进之路

kafka 七日更 28天写作 2月春节不断更

“新内容 新交互” 阿里云全球视频云创新挑战赛正式开启!

阿里云CloudImagine

阿里云 音视频 应用

Elasticsearch Bulk API 奇特的 JSON 格式

escray

七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

Spring Boot Admin 集成诊断利器 Arthas 实践

阿里巴巴云原生

Java Docker 容器 云原生 Arthas

一个合格的初级前端工程师需要掌握的模块笔记

我是哪吒

程序员 面试 Vue 大前端 2月春节不断更

您的《操作系统线程模型总结》请查收。

后台技术汇

28天写作 2月春节不断更

云搜索服务给你的不仅仅是Elasticsearch_语言 & 开发_华为云产品与解决方案_InfoQ精选文章