写点什么

GitHub 全新代码搜索引擎正式上线,但用户对新产品“不买账”

  • 2023-05-13
    北京
  • 本文字数:1404 字

    阅读完需:约 5 分钟

GitHub 全新代码搜索引擎正式上线,但用户对新产品“不买账”

18 个月后,GitHub 终于宣布向所有用户开放全新的代码搜索引擎。


在软件开发的过程中,阅读和理解代码是一项基础工作。无论是实现新功能,还是查找 bug,开发人员首先要阅读和理解代码,这个时间甚至多于编写代码。如果能够像搜索引擎一样,快速找到开发需要的上下文代码,那么软件开发的效率将会大幅提升。

 

但是 GitHub 上可供搜索的代码浩如烟海,全球代码仓库已经超过 2 亿,并且这些代码不是静态的:它在不断变化,这就给代码搜索引擎带来了相当大的挑战。

 

上线 15 年来,GitHub 一直努力给大家提供一个好用的代码搜索引擎,但一直不能如愿。因为之前的代码搜索基于 Elasticsearch,但代码搜索与一般文本搜索有着很大的区别,毕竟代码是写给机器来理解的,需要利用代码之间的结构和相关性,并且还需要支持正则表达式进行搜索。

 

从 2020 年开始,GitHub 开始全力以赴构建自定义搜索引擎。这款代码搜索引擎被命名为 Blackbird,用 Rust 编写,它创建并增量维护一个由 Git blob 对象 ID 分片的代码搜索索引。增量的形式能节省大量存储空间,并保证了跨分片的均匀负载分布。同时支持对文档内容进行正则表达式搜索,还可以捕获额外的元数据,例如它还维护符号定义的索引。最终 Blackbird 满足了大家的性能目标:速度非常快,索引也非常紧凑,重量约为(去重)语料库大小的 1/3。

 

该代码搜索引擎于 2021 年底推出预览版,这周,GitHub 宣布其“普遍可用”。

 

除代码搜索引擎是全新的之外,GitHub 还推出了一个完全重新设计的搜索界面。新界面不仅提供建议与补全,还能对搜索结果进行智能分类。

 


另外,研发团队还重新设计了 GitHub 的代码视图,将搜索、浏览和代码导航紧密集成起来。

 


GitHub 全新的代码搜索正式上线后,有网友大赞其功能:“这是 5 年来最令人印象深刻的产品”,“很高兴能够在代码搜索中包含特殊字符!”

 

但不幸的是,也有不少用户给出了“不满意的”的反馈,要求有一种方法可以返回到旧版本。

 

CameronEnglish:“新的查看体验缓慢而糟糕。我并不真正关心新的代码搜索功能,因为我已经有了相关工具。视图更改极大地恶化了 Github 的体验。”

 

Shortnamesalex:“请给我们一个恢复到旧 UI 的选项。这个新 UI 太糟糕了。一切都感觉太局促但同时又太宽,而且代码字体令人眼花缭乱。”

 

还有网友说到:“我希望在编辑 Markdown 时看到对‘显示差异’功能的改进——以前,删除的内容是红色的,添加的内容是绿色的。现在这种差异却没有了。

 

但是这只是对新界面表达不满的其中几个,用户不断提出新问题:

 

 

可以说,GitHub 意识到了这些抱怨。“我们正在积极处理我们从社区收到的反馈,”公司发言人对外表示。“当我们构建新的代码搜索和代码视图时,我们优先考虑让开发人员能够快速搜索、导航和理解他们的代码,将关键信息置于上下文中,并最终提高他们的工作效率。这些优先事项仍然是我们的首要事项。”

 

参考链接:

 

https://github.blog/2023-05-08-github-code-search-is-generally-available/

https://github.com/orgs/community/discussions/54546#discussioncomment-5841984

https://www.theregister.com/2023/05/13/github_code_search_redesign_feedback/

 

2023-05-13 19:534782

评论

发布
暂无评论
发现更多内容

电商拍立淘按图搜索API接口详解及JSON数据格式示例

代码忍者

API 接口 pinduoduo API

My Sony LUT Pack(索尼相机lut预设包)

Rose

500种专业级Lut调色集合包

Rose

TLM算法原理和历史背景

思茂信息

cst cst使用教程 cst电磁仿真

OmniGraffle for mac思维导图软件中文版

Mac相关知识分享

《使用Gin框架构建分布式应用》阅读笔记:p251-p271

codists

Go gin 编程人 codists

IPQ5332 vs. IPQ5322: A Comparative Analysis of Qualcomm’s Quad-Core Wi-Fi 7 Platforms

wallyslilly

IPQ5332 ipq5322

地平线 3D 目标检测 bev_sparse 参考算法-V1.0

地平线开发者

自动驾驶 算法

DashText-快速开始

DashVector

大数据 向量检索 大模型

2025数据安全措施汇总看这里!

行云管家

数据安全 运维安全 企业数据安全 企业数据

千万级数据深分页查询SQL性能优化实践

京东科技开发者

工厂学习系统(源码+文档+部署+讲解)

深圳亥时科技

Sony Slog2 Natural Rec709(电影调色lut预设)

Rose

极狐GitLab 签约新大陆自动识别,以质量和安全让智能识别更精准

极狐GitLab

gitlab cicd

华为云开源项目Sermant正式成为CNCF官方项目

华为云开源

开源 微服务治理 cncf sermant

数字身份发展趋势前瞻:去中心化身份

芯盾时代

区块链 数字身份 身份安全

DashText-进阶使用

DashVector

大数据 大模型 向量数据库

课程实录 | 借助 F5 NGINX 交付极致用户体验(下)

NGINX开源社区

WebP nginx 开源版 HTTP/2

ReelSmart MotionBlur Pro (AE/PR动态模糊插件 )

Rose

昌都等保测评机构有哪些?电话多少?

行云管家

等保 等保测评 昌都

AI加持下的低代码:智能化开发的新时代

天津汇柏科技有限公司

低代码开发 AI 人工智能

如何快速使用向量检索服务DashVector?

DashVector

大数据 向量检索 大模型 向量检索数据库

兼职招聘平台(源码+文档+部署+讲解)

深圳亥时科技

AI职业发展不走弯路!人工智能权威学者吴恩达亲自指导,AI小白也能顺利拿到高质量offer!

可信AI进展

火山引擎ByteHouse推出“四大红利”,助企业降成本、提性能

字节跳动数据平台

数据库 大数据 大数据 火山引擎 云服务

ClearPlus v2.2 中文汉化 (AE/PR去朦胧除雾霾调色插件)

Rose

https 的本质、证书验证过程以及数据加密

京东科技开发者

【行云流水线】满足你对工作流编排的一切幻想~skr

京东科技开发者

极狐GitLab X 某全球智能制造强企,保护企业核心资产,让智能制造更安全、高效

极狐GitLab

gitlab cicd

过程管理系统

深圳亥时科技

如何限制用户修改long_query_time

GreatSQL

greatsql

GitHub 全新代码搜索引擎正式上线,但用户对新产品“不买账”_语言 & 开发_Tina_InfoQ精选文章