写点什么

云搜索服务给你的不仅仅是 Elasticsearch

  • 2020-03-27
  • 本文字数:1149 字

    阅读完需:约 4 分钟

云搜索服务给你的不仅仅是Elasticsearch

云搜索服务在不同场景下的技术能力主要体现在四个方面:



  • 站内搜索场景的智能化增强


在网站、APP、对话机器人等众多站内搜索场景中,经常会碰到两类问题导致搜索不准确。


一类是分词。比如新词或特有名词无法搜索、短语查询不准确、词库无法支持多租户等等。针对这些场景,华为将自研分词器嵌入云搜索服务中,为用户提供新词或者特有名词识别、英文短语支持、索引级别自定义词库等众多功能。


另一类是搜索结果排序。在 ES 中做搜索定制排序规则时,都是静态的,比如制定各个字段的权重,打分的算法等。但是在现实场景中,用户往往不是按照我们的打分规则来评判自己想要的东西。针对这些场景,云搜索服务可以根据用户点击历史数据训练模型进行重排序,达到越搜越准的效果。


  • 多媒体检索场景的多元化延伸


在多媒体搜索场景中,最通常的就是通过图片的描述进行搜索,但是这种方式很有局限性,搜索的结果完全取决于描述的正确性以及搜索语句是否合适。云搜索服务在开源的 ES 基础之上,增强了对图片特征向量检索相关技术的支持,实现了以图搜图,以及图片与文本的协同搜索。有了对图片搜索的支持,云搜索服务把 ES 扩展到了图片版权查询、手机拍照查询等更多的应用场景中。


音频检索中,如何用音频片段在大量音频内容高效的找到匹配的音频,是传统方法面临的难题。云搜索服务结合全文检索技术,将音频指纹检索利用倒排索引加速,很好地解决了音频检索的性能问题。


  • 日志分析场景的便捷化扩展


在日志分析场景中,如何有效进行日志分析成为一个难题。总体而言,包括以下四个方面:日志分散,分析困难,容量有限和速度受制。云搜索服务利用云上优势,和数据接入、实时流计算、云数据迁移等服务打通,用户无需编程就可以搭建一套完整的日志解决方案。


同时,云搜索服务还给 ES 添加了更多的算子,比如 Last Hit,满足了用户更多的统计分析需求。


  • 云端运维能力的专业化积累


云服务在生产环境中必须要能长期、稳定、可靠的运行,这离不开运维系统和运维团队的保障。云搜索服务一键式的部署和扩容功能、自动备份机制、开放的 API 和可配置的监控告警平台,让用户从运维中解放出来。运维团队也构筑了 SRE 能力,从研发、基础设施、运营、运维等多个层次展开,并 7*24 小时 oncall 守护用户的服务稳定运行。


云搜索服务在对外提供服务的同时,也在为自己的服务提供着运维支撑。其利用 filebeat+logstash 收集管理面和业务面的日志,实现日志的可视化分析;收集数据库运维数据和用户 ES 集群的监控数据,做实时的监控和告警,让运维人员先于客户发现问题。这种自己的产品自己应用的方式,不仅检验了云搜索服务的稳定性,也在产品使用上积累了丰富的经验,从而为用户使用云搜索服务提供了更好的保障。


本文转载自华为云产品与解决方案公众号。


原文链接:https://mp.weixin.qq.com/s/UZZLmLPnhGADAYWsgu5gIw


2020-03-27 22:19970

评论

发布
暂无评论
发现更多内容

学生管理系统设计文档

Geek_cb2b43

契约测试理论篇

刘冉

软件测试 契约测试

聚焦云原生,阿里云与 CNCF 共话「云未来,新可能」

阿里巴巴云原生

阿里云 云原生 活动 KubeCON

服务端系统性能测试

刘冉

性能测试

如何使用 JavaScript 扁平化/非扁平化嵌套 JSON 对象?

devpoint

JavaScript json Object 11月日更

【架构实战营】模块三作业

liu🍊

性能测试之并发模型对比(JMeter,Locust和Gatling篇)

刘冉

软件测试 性能测试 自动化测试

探索式测试落地实践

刘冉

探索测试

EDAS 4.0 助力企业一站式实现微服务架构转型与 K8s 容器化升级

阿里巴巴云原生

阿里云 云原生 PaaS EDAS

Python 官方研讨会:彻底移除 GIL 真的可行么?

Python猫

Python

纯CSS实现轮播图

Augus

CSS 11月日更

学习心得 - 架构训练营 - 第八课

Fm

MyBatis 中为什么不建议使用 where 1=1?

王磊

mybatis

学习心得 - 架构训练营 - 第七课

Fm

一分钟搞懂DDD

俞凡

架构 DDD

软件测试中的服务虚拟化

刘冉

Mock测试框架 服务虚拟化

2021年了,数据分析还吃香么?

Geek_utwige

Python 最佳实践 数据分析 爬虫 职业发展

模块四作业

bob

「架构实战营」

数据产品经理实战-数据分析能力养成

第519区

数据分析 数据产品

测试用例编写和管理

刘冉

软件测试 测试用例

自定义View:如何实现图片放大后拖动和滑动效果

Changing Lin

11月日更

Java8中Stream初试

Geek_4bdbe1

Scrum模式之估算点模式读后感

Bruce Talk

敏捷 随笔 Agile User Story Scrum Patterns

【高并发】从源码角度分析创建线程池究竟有哪些方式

冰河

Java 并发编程 多线程 高并发 异步编程

学生管理系统详细架构设计文档

21°Char

大数据训练营一期毕业作业

朱磊

linux之ClamAV杀毒软件安装配置

入门小站

Linux

架构实战营模块三作业

spark99

架构实战营

北鲲云超算平台对于基因组学研究能够提供哪些帮助?

北鲲云

Flink 实践教程-入门(7):消费 Kafka 数据写入 PG

腾讯云大数据

flink 流计算 Oceanus

瀑布vs敏捷质量控制

刘冉

敏捷开发 敏捷测试

云搜索服务给你的不仅仅是Elasticsearch_语言 & 开发_华为云产品与解决方案_InfoQ精选文章