大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

eBay 在软件开发生产率方面使用生成式 AI 的经验

Claudio Masolo

  • 2024-04-05
    北京
  • 本文字数:1019 字

    阅读完需:约 3 分钟

eBay 在软件开发生产率方面使用生成式AI的经验

最近,eBay 披露了在开发过程中使用生成式 AI 的经验教训。eBay 在通过 AI 提高开发人员的工作效率方面发现了三个关键途径,即集成商业产品、微调现有的大语言模型(Large Language Models,LLMs) 以及利用内部的知识网络。


采用 GitHub Copilot 等商业 AI 解决方案为 eBay 的开发人员社区带来了可喜的成果。在一项经过精心设计的 A/B 测试中,使用 Copilot 的开发人员展现出了更高的工作效率,代码接受率(通过 Copilot 遥测报告的代码接受率为 27%)和效率指标更高:生成代码的准确率为 60%。Github Copilot 的引入还降低了 PR(大约 17%),减少了变更的准备时间(大约 12%)。但是,像提示(prompt)大小限制等问题凸显了在 eBay 的庞大代码库背景下定制解决方案的必要性。


通过对 Code Llama(尤其是 Code Lllama 13B)等开源 LLM 进行后期培训和微调,eBay 开辟了一条新的途径,以简化劳动密集型任务和减少代码重复。eBayCoder 是一个基于组织专有数据(代码库和文档)训练而成的定制模型,它的开发成功证明了 LLM 定制在解决 eBay 生态系统特有的挑战方面的潜力。这种方式很好地解决了一些以往需要花费大量时间的任务,比如更新库以修复安全漏洞。


鉴于 eBay 代码库的广泛性和多样性,典型的商业大语言模型有可能只能访问与特性查询直接相关的数据和代码。通常情况下,这包括紧密相关的文件、当前的仓库和少量的依赖库。但是,这类模型可能会忽略其他团队管理的内部服务或非依赖库,即便它们提供了与当前开发完全一致的功能。因此,这往往会导致大量的代码冗余。与之不同,经过专门调整的 LLM 可以访问更广泛的环境,从而减少代码重复情况的出现。


eBay 认识到了简化内部知识访问的重要性,因此实现了内部 GPT 驱动的查询系统。借助检索增强生成(Retrieval Augmented Generation,RAG) 技术,该系统能够与现有的文档源无缝集成,使开发人员获得及时且相关性更强的见解。尽管在响应质量方面偶尔还会有小问题,但是通过从人类反馈中强化学习(Reinforcement Learning from Human Feedback,RLHF),随着时间的推移,eBay 能够使 GPT 驱动的查询变得更好。


在技术不断进步的动态环境中,eBay 的发展历程证明了 AI 集成的引入能够为开发人员和组织带来卓有成效的成果。


查看英文原文:

eBay’s Lessons Learned about Generative AI in Software Development Productivity (https://www.infoq.com/news/2024/03/ebay-generative-ai-development/)


声明:本文为 InfoQ 翻译,未经许可禁止转载。

2024-04-05 08:006845

评论

发布
暂无评论
发现更多内容

阿里云中“间“力量!RocketMQ

指剑

阿里云 RocketMQ 函数计算FC 事件总线Eventbridge

陈毅威“掌舵”SUSE 中国 3.0,谋势数字江湖

Rancher

一步一图带你构建 Linux 页表体系 —— 详解虚拟内存如何与物理内存进行映射

bin的技术小屋

内存管理 Linux Kenel Linux内核 页表 Linux内核源码

.net core基于HttpClient实现的网络请求库

互联网工科生

.net core http client

软件测试 | Java程序的注释

测吧(北京)科技有限公司

测试

软件测试 | 数据类型的转换

测吧(北京)科技有限公司

测试

语音标注平台是推动人工智能发展的关键工具之一

数据堂

NFTScan 与 Purelist 达成战略合作伙伴,双方在 NFT 一级发售方面展开合作

NFT Research

NFT\ 市场

语音标注平台是构建智能语音技术的重要基石

数据堂

打翻夏日调色盘,华为与你多巴胺一“夏”

最新动态

云智慧「智能运维6.0产品发布会」与您相约7.24运维日

云智慧AIOps社区

智能运维 #运维 智能运维AIOps 运维智能化

软件测试 | 在Windows平台安装MySQL

测吧(北京)科技有限公司

测试

与用户“同频”,海尔空调带来行业第三次科技革命

脑极体

绿色 空调

软件测试 | 在Linux平台下安装MySQL

测吧(北京)科技有限公司

测试

软件测试 | Windows平台下配置MySQL

测吧(北京)科技有限公司

测试

使用可视化低代码工具提高开发效率

互联网工科生

低代码 可视化开发 JNPF

语音数据标注平台让语音识别技术更精准

数据堂

定了!12支队伍进入HarmonyOS极客马拉松2023决赛

HarmonyOS开发者

HarmonyOS

DTT直播回顾:一文带你全面了解openGemini

华为云开源

时序数据库 开源数据库 openGemini

异步 I/O 探秘 —— 为什么说 Go 为我们提供了同步的网络编程接口 ?

蓬蒿

golang 异步IO asynchronous i/o netpoller

全面解析JMeter环境变量配置步骤

Liam

程序员 软件测试 测试 Jmeter 测试工具

从零开始学极狐GitLab|01 环境搭建

极狐GitLab

Linux DevOps gitlab DevSecOps 环境搭建

软件测试 | Java中的关键字

测吧(北京)科技有限公司

测试

MES/MOM国内市场现状趋势与新生态模式参考

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

Windows10 下 Neo4j1.5.8 安装教程

北桥苏

Python neo4j 图数据库 py2neo 知识问答系统

eBay 在软件开发生产率方面使用生成式AI的经验_AI&大模型_InfoQ精选文章