50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

eBay 在软件开发生产率方面使用生成式 AI 的经验

Claudio Masolo

  • 2024-04-05
    北京
  • 本文字数:1019 字

    阅读完需:约 3 分钟

eBay 在软件开发生产率方面使用生成式AI的经验

最近,eBay 披露了在开发过程中使用生成式 AI 的经验教训。eBay 在通过 AI 提高开发人员的工作效率方面发现了三个关键途径,即集成商业产品、微调现有的大语言模型(Large Language Models,LLMs) 以及利用内部的知识网络。


采用 GitHub Copilot 等商业 AI 解决方案为 eBay 的开发人员社区带来了可喜的成果。在一项经过精心设计的 A/B 测试中,使用 Copilot 的开发人员展现出了更高的工作效率,代码接受率(通过 Copilot 遥测报告的代码接受率为 27%)和效率指标更高:生成代码的准确率为 60%。Github Copilot 的引入还降低了 PR(大约 17%),减少了变更的准备时间(大约 12%)。但是,像提示(prompt)大小限制等问题凸显了在 eBay 的庞大代码库背景下定制解决方案的必要性。


通过对 Code Llama(尤其是 Code Lllama 13B)等开源 LLM 进行后期培训和微调,eBay 开辟了一条新的途径,以简化劳动密集型任务和减少代码重复。eBayCoder 是一个基于组织专有数据(代码库和文档)训练而成的定制模型,它的开发成功证明了 LLM 定制在解决 eBay 生态系统特有的挑战方面的潜力。这种方式很好地解决了一些以往需要花费大量时间的任务,比如更新库以修复安全漏洞。


鉴于 eBay 代码库的广泛性和多样性,典型的商业大语言模型有可能只能访问与特性查询直接相关的数据和代码。通常情况下,这包括紧密相关的文件、当前的仓库和少量的依赖库。但是,这类模型可能会忽略其他团队管理的内部服务或非依赖库,即便它们提供了与当前开发完全一致的功能。因此,这往往会导致大量的代码冗余。与之不同,经过专门调整的 LLM 可以访问更广泛的环境,从而减少代码重复情况的出现。


eBay 认识到了简化内部知识访问的重要性,因此实现了内部 GPT 驱动的查询系统。借助检索增强生成(Retrieval Augmented Generation,RAG) 技术,该系统能够与现有的文档源无缝集成,使开发人员获得及时且相关性更强的见解。尽管在响应质量方面偶尔还会有小问题,但是通过从人类反馈中强化学习(Reinforcement Learning from Human Feedback,RLHF),随着时间的推移,eBay 能够使 GPT 驱动的查询变得更好。


在技术不断进步的动态环境中,eBay 的发展历程证明了 AI 集成的引入能够为开发人员和组织带来卓有成效的成果。


查看英文原文:

eBay’s Lessons Learned about Generative AI in Software Development Productivity (https://www.infoq.com/news/2024/03/ebay-generative-ai-development/)


声明:本文为 InfoQ 翻译,未经许可禁止转载。

2024-04-05 08:006915

评论

发布
暂无评论
发现更多内容

雄安新区设立四周年,看天翼云以数字底座托起未来之城

天翼云开发者社区

信通院推出数字化赋能者新标准天翼云获评数字化转型赋能服务集体

天翼云开发者社区

中台和多云管理是伪问题?运维要集体下岗了吗?

火线安全

DevOps 云原生 云安全

QoS 设计:车联网平台消息传输质量保障|车联网平台搭建从入门到精通 04

EMQ映云科技

物联网 IoT mqtt coap emq

译文《Java并发编程之volatile》

潘大壮

并发编程 volatile 后端 Java EE

长连接网关技术专题(七):小米小爱单机120万长连接接入层的架构演进

JackJiang

网络编程 websocket 即时通讯 网关 长连接

限量独家!濒危动物数字藏品免费发放!

百度开发者中心

开学季 | 飞桨AI Studio课程学习,小白也可以成为一名优秀的算法工程师!

百度开发者中心

天翼云成为首个加入openGauss社区的运营商云

天翼云开发者社区

Rust 用于移动开发的几种方式

非凸科技

Java c++ Python rust 量化

公有云市场百舸争流!天翼云稳居第一梯队,进入领导者象限

天翼云开发者社区

以太坊的扩容革命:ETH2.0

不登山的小鲁

以太坊 扩容 Ethereum eth eth2.0

融云直播 SDK 升级,让直播「PK」起来

融云 RongCloud

直播 IM 场景化

多场景推进 服务网格在联通的落地实践(下)

百度开发者中心

春分耕种时,AI“现身”田间地头

百度开发者中心

Docker Build时的安全问题

火线安全

Docker 云原生 云安全 docker build

VuePress 博客之 SEO 优化(六)站长工具

冴羽

Vue 前端 vuepress SEO 博客搭建

跑马灯带你深入浅出TextView的源码世界

vivo互联网技术

android 源码分析 TextView

保姆级SpringBoot+Vue图片上传到阿里云OSS教程

沉默王二

Spring Boot

DevOps落地思考

火线安全

DevOps 云原生 云安全 DevOps认证

Gartner发布中国IaaS PaaS市场服务报告,天翼云强势入选

天翼云开发者社区

一文来了解关于分布式锁的那些事儿

Linux服务器开发

redis 分布式 分布式锁 Linux服务器开发 Linux后台开发

内存之旅——如何提升CMA利用率?

OpenHarmony开发者

内存 OpenHarmony

融云互联网通信安全揭秘之链路安全

融云 RongCloud

网络安全

企业在线产品宣传册应该如何设计?

小炮

产品宣传手册

2022年最热门的招聘技术技能是什么,您绝对想不到

禅道项目管理

项目管理 开发技能

电路模型和电路定律 (Ⅲ)

謓泽

3月月更

阿里巴巴云原生大数据运维平台 SREWorks 正式开源

阿里云大数据AI技术

大数据 自动化运维 大规模网络运维

如何理解基础服务和通用服务

Im胡子

基础服务 通用服务 基础服务边界

两会“数字经济”高频出位,博睿数据为企业数字转型提供有力引擎

博睿数据

百度希壤元宇宙平台上线首个汽车数字展厅,领克探索汽车营销新方式

百度开发者中心

eBay 在软件开发生产率方面使用生成式AI的经验_AI&大模型_InfoQ精选文章