GitHub基于大语言模型构建Copilot的经验和教训_生成式 AI

阿里云飞天发布时刻，领先大模型限免，超7000万 tokens免费体验了解详情 



 写点什么



大小：748.24K时长：04:15

GitHub在一篇文章中分享了他们在构建和扩展GitHub Copilot——一个使用大语言模型的企业应用——过程中所学到的经验教训。

在 GitHub 的一篇博文中，GitHub 的 AI 产品负责人Shuyin Zhao描述了他们如何在三年多的时间里历经三个阶段——“Find it”、“Nail it”和“Scale it”——成功推出了 GitHub Copilot。

在“Find it”阶段，他们专注于找到 AI 可以有效解决的问题，通过一种足够专注的方式快速推向市场，并且足以产生影响。

这包括确定到底是为了谁而解决问题——帮助开发人员更快地编写代码，减少上下文切换。此外，他们只关注SDLC的一部分：IDE中的编码功能，并结合当下的 LLM 的能力。这样他们就可以专注于让工具提供代码建议，而不是生成全部代码。他们还致力于确保他们所做的是对现有工具进行增强，不要求开发人员改变已有的工作流程。

“在设计产品时，我们不仅要考虑输出需要人类进行评估的模型，也要考虑正在学习如何与 AI 互动的人类。”

——Idan Gazit，GitHub Next 高级研发总监

在“Nail it”阶段，他们基于从A/B测试中获得的真实用户反馈进行迭代式产品开发。他们进行快速迭代、试错和学习。在使用 Copilot 的 Web 接口进行了简短的实验后，他们将重点转向了 IDE，以减少在编辑器和 Web 浏览器之间切换，并让 AI 在后台运行。在进一步的迭代中，通过观察开发人员在编码时打开的多个 IDE 选项卡，GitHub Copilot 可以同时处理多个文件。

随着生成式 AI 的迅速发展，他们开始重新审视过去所做出的决策，技术的进步和用户对它的熟悉程度有时会让过去的决策变得过时。于是，提供交互式聊天的想法开始活跃起来，他们需要基于沉没成本谬论改变决策，例如，当大语言模型的进步允许一个模型处理多种语言时，就需要改变为每种语言构建 AI 模型的想法。

最后，在“Scale it”阶段，他们致力于确保 AI 模型结果的一致性、管理用户反馈，并定义了关键性能指标，以实现应用程序的普遍可用性(GA)。他们还考虑了安全性和 AI 责任问题，使用过滤器来避免为用户建议不安全或具有冒犯性的代码。

改进质量和可靠性方面的工作包括缓解大语言模型的幻觉，即答案可能是不可预测的，并且每次查询都有所不同。解决这个问题的策略包括修改发送给大语言模型的参数，以减少响应的随机性，并缓存频繁的响应以减少变化和提高性能。

GitHub 使用等待列表来管理技术预览版的早期用户。这意味着他们可以获得来自一小群早期采用者的评论和反馈。对真实用户反馈的深入分析使得 GitHub 团队能够识别出有问题的更新，并改进产品的关键性能指标，例如开发人员保留了多少由 Copilot 生成的代码。

最后，他们确保开发人员生成的代码是安全的，并通过过滤器来拒绝可能引入安全问题(如 SQL 注入)的代码建议。社区也提出了一些问题，例如 Copilot 的代码建议与公开的代码相重叠可能会产生许可问题或其他影响。他们为此提供了一个代码参考工具，帮助开发人员做出明智的选择。

在市场策略方面，他们向一些有影响力的社区成员展示了技术预览版，并且面向的是个人用户而不是企业。这有助于在正式发布时获得广泛的支持，从而促使企业采用它。

关键在于展示专注于特定问题的重要性、整合实验结果和用户反馈，以及在应用扩展时优先考虑用户需求。

由于生成式 AI 的采用仍处于早起阶段，GitHub 也在密切关注市场对生成式 AI 工具的需求。感兴趣的读者可在 GitHub 的博客上阅读全文。

原文链接：

https://www.infoq.com/news/2023/10/github-copilot-lessons/

发布

暂无评论

创作场景

GitHub 基于大语言模型构建 Copilot 的经验和教训

评论

一口气搞懂【Linux内存管理】，就靠这60张图、59个问题了

架构实战营 - 模块 3 - 作业

有趣的灵魂万里挑一：从智能座舱看汽车进化史

架构实战营4期-模块3作业

一周信创舆情观察（12.20~12.26）

【架构实战营】模块三：命题作业

费用节省 50%，函数计算 FC 助力分众传媒降本增效

一年又要过去了！盘点2021年区块链的6个关键词

最近火热的web3到底是什么？

架构实战营：模块三作业

阿里巴巴超大规模 Kubernetes 基础设施运维体系揭秘

外包学生管理系统详细设计文档

深入理解一下Python中的面向对象编程

高效工作？畅快游戏？来开发者Meetup探索AI技术新玩法

架构实战模块三作业

百度飞桨EasyDL桌面版正式上线，没网也能训练AI！

阿里云王志坤：强劲可靠、无处不在的云，为创新保驾护航

Hoo研究院币 | 币海寻珠——加密行业即将到来的发售事件

学习总结 2021.12.30

百度智能云发布零碳园区解决方案，助力实现双碳目标

Git基础｜打tag

以 Kubernetes 的方式来运行极狐GitLab Runner

VS Code 如何设置大小写转换快捷键

引领人工智能技术自立自强百度吴甜获评“首都最美巾帼奋斗者”

从人工到智能！百度AI开发者大会分论坛，探寻国球乒乓背后的AI之路

ARMS 应用安全-你的应用运行时的隐形安全卫士

LabVIEW图像增强算法（基础篇—5）

元宇宙很好，但VR开发者不准备停留在这里

【架构实战营】模块三：知识点总结

第三周学习总结

为什么说绿色区块链是未来金融范式的必要底层？

创作场景

GitHub 基于大语言模型构建 Copilot 的经验和教训

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载