10 月 23 - 25 日,QCon 上海站即将召开,现在大会已开始正式报名,可以享受 8 折优惠 了解详情
写点什么

云搜索服务给你的不仅仅是 Elasticsearch

  • 2020-03-27
  • 本文字数:1149 字

    阅读完需:约 4 分钟

云搜索服务给你的不仅仅是Elasticsearch

云搜索服务在不同场景下的技术能力主要体现在四个方面:



  • 站内搜索场景的智能化增强


在网站、APP、对话机器人等众多站内搜索场景中,经常会碰到两类问题导致搜索不准确。


一类是分词。比如新词或特有名词无法搜索、短语查询不准确、词库无法支持多租户等等。针对这些场景,华为将自研分词器嵌入云搜索服务中,为用户提供新词或者特有名词识别、英文短语支持、索引级别自定义词库等众多功能。


另一类是搜索结果排序。在 ES 中做搜索定制排序规则时,都是静态的,比如制定各个字段的权重,打分的算法等。但是在现实场景中,用户往往不是按照我们的打分规则来评判自己想要的东西。针对这些场景,云搜索服务可以根据用户点击历史数据训练模型进行重排序,达到越搜越准的效果。


  • 多媒体检索场景的多元化延伸


在多媒体搜索场景中,最通常的就是通过图片的描述进行搜索,但是这种方式很有局限性,搜索的结果完全取决于描述的正确性以及搜索语句是否合适。云搜索服务在开源的 ES 基础之上,增强了对图片特征向量检索相关技术的支持,实现了以图搜图,以及图片与文本的协同搜索。有了对图片搜索的支持,云搜索服务把 ES 扩展到了图片版权查询、手机拍照查询等更多的应用场景中。


音频检索中,如何用音频片段在大量音频内容高效的找到匹配的音频,是传统方法面临的难题。云搜索服务结合全文检索技术,将音频指纹检索利用倒排索引加速,很好地解决了音频检索的性能问题。


  • 日志分析场景的便捷化扩展


在日志分析场景中,如何有效进行日志分析成为一个难题。总体而言,包括以下四个方面:日志分散,分析困难,容量有限和速度受制。云搜索服务利用云上优势,和数据接入、实时流计算、云数据迁移等服务打通,用户无需编程就可以搭建一套完整的日志解决方案。


同时,云搜索服务还给 ES 添加了更多的算子,比如 Last Hit,满足了用户更多的统计分析需求。


  • 云端运维能力的专业化积累


云服务在生产环境中必须要能长期、稳定、可靠的运行,这离不开运维系统和运维团队的保障。云搜索服务一键式的部署和扩容功能、自动备份机制、开放的 API 和可配置的监控告警平台,让用户从运维中解放出来。运维团队也构筑了 SRE 能力,从研发、基础设施、运营、运维等多个层次展开,并 7*24 小时 oncall 守护用户的服务稳定运行。


云搜索服务在对外提供服务的同时,也在为自己的服务提供着运维支撑。其利用 filebeat+logstash 收集管理面和业务面的日志,实现日志的可视化分析;收集数据库运维数据和用户 ES 集群的监控数据,做实时的监控和告警,让运维人员先于客户发现问题。这种自己的产品自己应用的方式,不仅检验了云搜索服务的稳定性,也在产品使用上积累了丰富的经验,从而为用户使用云搜索服务提供了更好的保障。


本文转载自华为云产品与解决方案公众号。


原文链接:https://mp.weixin.qq.com/s/UZZLmLPnhGADAYWsgu5gIw


2020-03-27 22:19963

评论

发布
暂无评论
发现更多内容

打造次世代分析型数据库(四):几十张表关联?小Case!

腾讯云大数据

数据库

支持私有化部署的WorkPlus,助您构建定制化的即时通讯平台

BeeWorks

软件测试 | AI大模型应用开发实训营来啦~ 大模型学习资料免费领

测试人

人工智能 程序员 AI 软件测试 大数据模型

免费但很全能,Amazon CodeWhisperer 让编程更快

科技热闻

亮相数字科技出海峰会,火山引擎边缘云助力数字化出海“加速度”

火山引擎边缘云

CDN 加速 火山引擎 内容分发 火山引擎边缘计算

软件测试/测试开发丨探索AI与测试报告的完美结合,提升工作效率

测试人

人工智能 程序员 软件测试 ChatGPT

龙蜥社区与您相约 2023 KubeCon

OpenAnolis小助手

开源 容器 云原生 龙蜥社区 kata

根据人类反馈进行强化学习的5大关键步骤

澳鹏Appen

大模型 数据训练 生成式AI LLM RLHF

2023-09-27:用go语言,在一个 n x n 的国际象棋棋盘上,一个骑士从单元格 (row, column) 开始, 并尝试进行 k 次移动。行和列是 从 0 开始 的,所以左上单元格是 (0

福大大架构师每日一题

福大大架构师每日一题

一步教会你如何获取1688商品详情

Noah

API 开发

适合企业的跨隔离网文件摆渡的四种方式及优缺点

镭速

跨网文件交换 跨隔离网文件摆渡

Java第一个程序——Hello,World!

小齐写代码

DEFI/DApp/DAO/IDO/LP子母币/单双币/机枪池流动性代币质押项目挖矿系统开发

l8l259l3365

四问复合索引,让你的数据查询速度飞起

华为云开发者联盟

后端 华为云 图数据库 华为云开发者联盟 企业号9月PK榜

SQL还是NoSQL?架构师必备选型技能

树上有只程序猿

nosql sql 业务

用智能文字识别技术赋能古彝文数字化之路

dvlinker

人工智能 深度学习 合合信息 古彝文 智能文字识别技术

企业即时通讯解决方案,WorkPlus助力高效沟通与协作

BeeWorks

企业即时通讯

2000字说清音视频在社交娱乐场景中的应用!

X2Rtc

音视频 RTC 社交娱乐 融合通信

优化模型之标注错误篇

矩视智能

深度学习 工业机器视觉

软件测试/测试开发丨利用人工智能自动找Bug

测试人

人工智能 程序员 软件测试 bug ChatGPT

聚焦华为全联接大会:和鲸科技与华为携手助推交叉学科应用型数据科学人才培养

ModelWhale

华为 人才培养 数据科学 高等教育 交叉学科

腾讯云数据库再获顶会认可,论文入选VLDB2023

极客天地

Sovit2D组态设计 Web Scada烟气脱硫工艺流程

2D3D前端可视化开发

物联网 组态软件 工业控制 工业自动化 烟气脱硫

低功耗引擎Cliptrix有什么价值

Onegun

物联网 IoT

一文了解企业如何实现文件自动化实时同步

镭速

文件同步

DeFi 集成:扩大加密货币交易平台开发的视野

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 区块拉开发

Mate 60系列搭载方舟引擎,华为游戏中心解锁飞驰游戏体验

最新动态

代码检查过程中为什么需要涉及到编译呢?

华为云开发者联盟

开发 华为云 华为云开发者联盟 代码检查 企业号9月PK榜

云搜索服务给你的不仅仅是Elasticsearch_语言 & 开发_华为云产品与解决方案_InfoQ精选文章