【FCon上海】与行业领袖共话AI大模型、数字化风控等前沿技术。 了解详情
写点什么

域名搜索引擎

收录了 域名搜索引擎 频道下的 50 篇内容

软件工程师需要了解的搜索引擎知识

Max Grigorev最近写了一篇文章,题目是《What every software engineer should know about search》,这篇文章里指出了现在一些软件工程师的问题,他们认为开发一个搜索引擎功能就是搭建一个ElasticSearch集群,而没有深究背后的技术,以及技术发展趋势。Max认为,除了搜索引擎自身的搜索问题解决、人类使用方式等之外,也需要解决索引、分词、权限控制、国际化等等的技术点,看了他的文章,勾起了我多年前的想法。 很多年前,我曾经想过自己实现一个搜索引擎,作为自己的研究生论文课题,后来琢磨半天没有想出新的技术突破点(相较于已发表的文章),所以切换到了大数据相关的技术点。当时没有写出来,心中有点小遗憾,毕竟凭借搜索引擎崛起的谷歌是我内心渴望的公司。今天我就想结合自己的一些积累,聊聊作为一名软件工程师,您需要了解的搜索引擎知识。

比Bing更早将LLM集成到搜索引擎中,这家由谷歌前高管创立的公司为什么还是失败了?
比 Bing 更早将 LLM 集成到搜索引擎中,这家由谷歌前高管创立的公司为什么还是失败了?

Neeva 更快、更简单且无广告。但做出比谷歌更好的东西,却并不足以击败谷歌。

1688 域名切换——看我空中换引擎

经过10年发展,阿里巴巴中文站有853个域名备案、200多个相关应用,其中一部分域名已经转移或者下线,在剩下的约600个域名当中,不少存在使用不规范、分配不合理等问题。我们在不影响200多个应用正常运转的情况下,完成了这个域名切换的乾坤大挪移。

Python数据挖掘与机器学习实战(三):网络爬虫原理与设计实现
Python 数据挖掘与机器学习实战(三):网络爬虫原理与设计实现

**编者按**:本文节选自方巍著《Python数据挖掘与机器学习实战》一书中的部分章节。

为规避运营风险,俄罗斯搜索巨头 Yandex 更换域名转移重心
为规避运营风险,俄罗斯搜索巨头 Yandex 更换域名转移重心

Yandex 的做法将对俄罗斯互联网格局带来重大转变

百度HTTPS部署实践
百度 HTTPS 部署实践

本文将为大家介绍百度进行HTTPS部署的实践和一些权衡,希望以此抛砖引玉。

京东 618:商城分布式智能容器 DNS 实践

随着京东业务的高速增长,以及JDOS2.0的线上大规模运营,进而容器集群的编排成为常态,Pod失效也成为常态,RS(Replication Set)在处理失效Pod时候会带来IP的变化。这样容器之间基于IP相互访问就有可能存在问题。所以一个强大的能支持百万级hostname域名解析服务,可以很好地解决这个问题。

伪装成马斯克,一条推文骗取百万,骗局分析揭示真相
伪装成马斯克,一条推文骗取百万,骗局分析揭示真相

有人在推特上伪装成马斯克,竟成功骗到100多万,于是有人用简单有效的技术分析了这个骗局。

过滤器气泡:谷歌如何影响你的搜索结果?
过滤器气泡:谷歌如何影响你的搜索结果?

过滤器气泡可以根据你的个人数据来操纵你的搜索结果。谷歌通过你的个人信息(例如你的搜索、浏览和购买历史记录)产生这些被编辑过的结果,并根据算法认为你最有可能点击哪些内容将你置于某个“气泡”中。

网站不收录是受哪些因素影响?
网站不收录是受哪些因素影响?

网站不被搜索引擎收录是网站优化中的一个常见问题。搜索引擎的爬虫通过遍历网站上的链接和内容来确定网站的内容和价值,并将其添加到搜索引擎索引中。如果您的网站没有被收录,那么您的目标受众可能无法找到您的网站,这可能会导致流量下降和销售收入减少。以

三周年连更
境外业务性能优化实践
境外业务性能优化实践

本文来自美团点评技术文章系列。

移动站点生成便捷之路:百度 SiteApp

PC终端和移动终端在屏幕尺寸、输入方式、网络状况和浏览器能力等方面存在较大差异,导致了传统PC互联网页面在移动终端上的使用体验较差。作为其他中小网站的风向标,各大门户站点及知名网站,在过去两年中均都投入了相当的资源去打造自己的移动站点。缺少资源构建移动版本的网站如何通过简单手段生成自己的移动站点?昨晚,在中关村3W咖啡馆的西二旗夜话中,百度为大家详细介绍了他们在9月3日发布的百度七武器之一:SiteApp服务。

Web 是否应该被加密?

8月4日,电子前线基金会(EFF)和Tor共同发布了HTTPS Everywhere的官方1.0版,它通过加密到超过1000个站点的链接来保护Firefox浏览器的浏览行为。

15条重点解读快速搭建网站
15 条重点解读快速搭建网站

如何低门槛快速搭建自己的网站成了众多中小企业和个人关心的重点,华为云云速建站针对中小企业及个人开发的拖拽式快速搭建网站,实现产品的推广及营销。

15条重点解读快速搭建网站
15 条重点解读快速搭建网站

云速建站还支持多种拓展功能,需要进行对接与开通才能使用。

APIs.json: 用于发布和发现 API 的工具

APIs.json是一种API的定义格式,这种格式的文件可以用于向外界传达某个网站所提供的API,并将他们的API开放给搜索引擎,从而可被发现。APIs.json与robots.txt有些类似,robots.txt是一种被搜索引擎用来索引网站内容的文件,而APIs.json则被应用于API的发现和索引。

搞定网络隐私安全,这10款免费安全工具值得尝试
搞定网络隐私安全,这 10 款免费安全工具值得尝试

网络隐私很重要。那如何保护?本文重点介绍了几种安全的免费隐私保护产品。

Cloudflare Proxies 内存泄漏,又称“Cloudbleed”

一个缓冲区溢出缺陷导致了数据泄露,少量发往Cloudflare proxies的请求拿到了其他不相关请求数据,包括潜在的敏感数据,例如密码、其他秘密信息。这个问题已经被命名为“Cloudbleed”,由谷歌零漏洞项目组研究员Tavis Ormandy发现并记录。

推荐一个技术文章搜索引擎:十年积累,一键触达!

授人以鱼不如授人以渔,这个小小的工具,将会让你的学习成长,事半功倍。

域名搜索引擎专题_资料-InfoQ中文网