写点什么

云搜索服务给你的不仅仅是 Elasticsearch

  • 2020-03-27
  • 本文字数:1149 字

    阅读完需:约 4 分钟

云搜索服务给你的不仅仅是Elasticsearch

云搜索服务在不同场景下的技术能力主要体现在四个方面:



  • 站内搜索场景的智能化增强


在网站、APP、对话机器人等众多站内搜索场景中,经常会碰到两类问题导致搜索不准确。


一类是分词。比如新词或特有名词无法搜索、短语查询不准确、词库无法支持多租户等等。针对这些场景,华为将自研分词器嵌入云搜索服务中,为用户提供新词或者特有名词识别、英文短语支持、索引级别自定义词库等众多功能。


另一类是搜索结果排序。在 ES 中做搜索定制排序规则时,都是静态的,比如制定各个字段的权重,打分的算法等。但是在现实场景中,用户往往不是按照我们的打分规则来评判自己想要的东西。针对这些场景,云搜索服务可以根据用户点击历史数据训练模型进行重排序,达到越搜越准的效果。


  • 多媒体检索场景的多元化延伸


在多媒体搜索场景中,最通常的就是通过图片的描述进行搜索,但是这种方式很有局限性,搜索的结果完全取决于描述的正确性以及搜索语句是否合适。云搜索服务在开源的 ES 基础之上,增强了对图片特征向量检索相关技术的支持,实现了以图搜图,以及图片与文本的协同搜索。有了对图片搜索的支持,云搜索服务把 ES 扩展到了图片版权查询、手机拍照查询等更多的应用场景中。


音频检索中,如何用音频片段在大量音频内容高效的找到匹配的音频,是传统方法面临的难题。云搜索服务结合全文检索技术,将音频指纹检索利用倒排索引加速,很好地解决了音频检索的性能问题。


  • 日志分析场景的便捷化扩展


在日志分析场景中,如何有效进行日志分析成为一个难题。总体而言,包括以下四个方面:日志分散,分析困难,容量有限和速度受制。云搜索服务利用云上优势,和数据接入、实时流计算、云数据迁移等服务打通,用户无需编程就可以搭建一套完整的日志解决方案。


同时,云搜索服务还给 ES 添加了更多的算子,比如 Last Hit,满足了用户更多的统计分析需求。


  • 云端运维能力的专业化积累


云服务在生产环境中必须要能长期、稳定、可靠的运行,这离不开运维系统和运维团队的保障。云搜索服务一键式的部署和扩容功能、自动备份机制、开放的 API 和可配置的监控告警平台,让用户从运维中解放出来。运维团队也构筑了 SRE 能力,从研发、基础设施、运营、运维等多个层次展开,并 7*24 小时 oncall 守护用户的服务稳定运行。


云搜索服务在对外提供服务的同时,也在为自己的服务提供着运维支撑。其利用 filebeat+logstash 收集管理面和业务面的日志,实现日志的可视化分析;收集数据库运维数据和用户 ES 集群的监控数据,做实时的监控和告警,让运维人员先于客户发现问题。这种自己的产品自己应用的方式,不仅检验了云搜索服务的稳定性,也在产品使用上积累了丰富的经验,从而为用户使用云搜索服务提供了更好的保障。


本文转载自华为云产品与解决方案公众号。


原文链接:https://mp.weixin.qq.com/s/UZZLmLPnhGADAYWsgu5gIw


2020-03-27 22:191003

评论

发布
暂无评论
发现更多内容

SpringBoot3基础用法

Java 架构 springboot SpringBoot3

为什么要推进“电子凭证会计数据标准化”?

用友BIP

电子凭证

杭钢集团:用友iuap为数智底座的数智化转型之路

用友BIP

数智底座

加速中产 “返贫” 的4个迹象

博文视点Broadview

文心一言 VS 讯飞星火 VS chatgpt (72)-- 算法导论7.1 3题

福大大架构师每日一题

福大大架构师每日一题

中国电信与国家信息中心共同发布国信政务云

天翼云开发者社区

云计算 政务云

HTML5 Canvas 和 SVG哪个简单好用

2D3D前端可视化开发

html5 SVG 数据可视化 canvas 前端设计

那些被忽视的Python核心功能...

互联网工科生

Python

阿里云 EMAS & 魔笔:7月产品动态

移动研发平台EMAS

阿里云 消息推送 移动开发 低代码开发 app自动化测试

拓展知识 启望未来 | 记内蒙古移动《AntDB ACA初级认证培训》活动

亚信AntDB数据库

数据库 AntDB AntDB数据库

AREX 如何支持 Dubbo 自定义私有协议的录制回放

AREX 中文社区

dubbo 自动化测试 流量回放 流量录制

JMeter源码解析之结果收集器

优测云服务平台

Jmeter 性能测试 压力测试 #性能测试

带你走进数仓大集群内幕丨详解关于作业hang及残留问题定位

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

技术分享 | StoneData 的身份认证与访问控制策略:构建安全可靠的数据分析环境

StoneDB

MySQL 数据库 HTAP StoneDB

一文让你了解网络安全和云安全的区别与联系

行云管家

云计算 网络安全 云安全

Flink 实践教程:入门(12):元数据的使用

腾讯云大数据

流计算 Oceanus

CommunityOverCode Asia 专题介绍之流处理

Apache Flink

大数据

一文读懂快速开发平台

互联网工科生

低代码 开发平台 JNPF

为什么要选择文件传输软件?有哪些最佳高速文件传输软件?

镭速

文件传输软件

那些 MySQL 8.0 中的隐藏特性

爱可生开源社区

MySQL 8.0

华为阅读与博集新媒达成合作 推进数字化阅读高质量发展

最新动态

基于PINN的传播动力学研究

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

企业选择大文件传输软件的真正原因

镭速

大文件传输软件

大文件传输软件| 生命科学中的关键因素

镭速

大文件传输快速

NFTScan | 07.31~08.06 NFT 市场热点汇总

NFT Research

NFT\

云搜索服务给你的不仅仅是Elasticsearch_语言 & 开发_华为云产品与解决方案_InfoQ精选文章