写点什么

首个专为半导体行业设计的开源大模型 SemiKong 问世

  • 2024-07-15
    北京
  • 本文字数:1035 字

    阅读完需:约 3 分钟

首个专为半导体行业设计的开源大模型 SemiKong 问世

7 月 10 日,国外初创公司 Aitomatic 宣布推出 SemiKong。这是世界上第一个专为半导体行业设计的开源 AI 大型语言模型(LLM)。它旨在通过将特定领域的知识纳入模型来解决半导体行业面临的一些挑战,例如有关半导体器件和工艺的物理和化学问题。



SemiKong 由人工智能联盟(AI Alliance)成员合作研发。AI 联盟成立于 2023 年,致力于构建、支持和倡导整个 AI 技术领域的开放式创新,包括软件、数据和模型、安全、安保和信任、工具、评估、硬件、教育、开放科学和宣传。


SemiKong 基于联盟成员 Meta 开源的 Llama3 模型,利用了包括 Tokyo Electron 在内的领先半导体公司和 FPT Software 等 AI 专家的专业知识。IBM 研究院 AI 开放创新负责人 Anthony Annunziata 强调,“SemiKong DRAFT v0.6 的诞生表明,汇集不同的专业知识能推动半导体制造等关键行业的重大进步。”


SemiKong 的训练过程主要分为 3 个主要阶段:预训练领域知识——自我微调(指令数据集)——合并和量化。从放出的代码权重,可以看出 SemiKong 有 8B 的参数。它在准确性、相关性和对半导体工艺的理解方面表现出了显著的进步。


Aitomatic 表示,即使是其较小版本,在特定领域的应用中也常常超越较大的通用模型,从而有可能加速整个半导体价值链的创新并降低成本。并且,它也为那些打造适合自身的专有模型的芯片公司提供了一个有价值的基座。



随着 SemiKong 降低半导体生产成本,消费者可以在未来几年内以更低的价格看到功能更强大的智能手机、笔记本电脑和智能家居设备。SemiKong 于 2024 年 7 月 9 日起在 HuggingFace 和 GitHub 上提供下载。下一个更强大的版本计划于 2024 年 12 月推出,预计 2024 年 9 月将推出首批特定工艺型号。


开源地址:https://github.com/aitomatic/semikong


SemiKong 项目的领导者, Aitomatic 首席执行官 Christopher Nguyen 表示:“SemiKong 将重新定义半导体制造业。这种开放式创新模式由人工智能联盟提供支持,利用集体专业知识应对行业特定挑战。在 Aitomatic,我们正在使用 SemiKong 创建领域特定 AI 智能体,以前所未有的效率解决复杂的制造问题。”


Tokyo Electron 高级专家、半导体行业模型的早期提出者 Daisuke Oku 补充道:“SemiKong 是半导体开源 AI 的一个令人激动的开始。Aitomatic 的创新方法有可能为我们的行业带来巨大的飞跃。”


参考链接:


https://www.prnewswire.com/news-releases/aitomatic-unveils-semikong-ai-breakthrough-set-to-reshape-500b-semiconductor-industry-302194215.html


https://www.semikong.ai/


2024-07-15 09:377684

评论 1 条评论

发布
用户头像
这个和RAG的技术路线区别是什么?
2024-07-15 10:38 · 湖北
回复
没有更多了
发现更多内容

Baklib+伙伴云+企微会话存档,打造伙伴云帮助中心运营体系

Baklib

盘点团队在线协作文档工具

Baklib

在线协作文档

什么是实时渲染,3D实时渲染的优缺点

3DCAT实时渲染

云计算 元宇宙 实时渲染 实时云渲染 云VR

Vue3入门指北(五)条件渲染

Augus

Vue 3 9月月更

全方位助力数据科学组织协同&个人研究:ModelWhale 产品功能介绍与版本选择指引

ModelWhale

云计算 科技 数据科学 编程建模 组织协同

当下企业数字化转型,PaaS是基础解

ToB行业头条

产品经理必看的高效产品文档撰写指南

Baklib

产品 产品经理 文档

ESP32-C3 学习测试 蓝牙 篇(二、蓝牙调试APP、开发板手机连接初体验)

矜辰所致

ESP32-C3 9月月更 蓝牙APP

开发者有话说|刚毕业的“00后”,歪打误撞进入了SAP行业

暮春零贰

个人成长 9月月更

企业IT运维开发一体化解决方案

力软低代码开发平台

联通研究院霍龙社博士深度解析“AI项目到底适不适合开源”

OpenI启智社区

人工智能 OpenI启智社区 AI开源 CubeAI智立方

软件测试 | 测试开发 | 提高Android云真机稳定性的方法

测吧(北京)科技有限公司

测试

哪7个场景影响研发效能?

LigaAI

敏捷 LigaAI 企业号九月金秋榜 #敏捷开发 #程序

面试整理的45W字Java真题和答案详解(含核心考点及6家大厂真题)

Geek_0c76c3

Java 数据库 开源 程序员 开发

从新零售、物流到广告,搞定指标中台就这么简单!

Kyligence

数据分析 指标管理 指标中台

一文读懂TDengine的三种查询功能

TDengine

数据库 tdengine 时序数据库 企业号九月金秋榜

华为应用市场审核指南解读课程上线,面向开发者讲解应用审核2022年更新要点

最新动态

专访美象科技|中国数字孪生50强为何需要3DCAT实时渲染云的赋能?

3DCAT实时渲染

云计算 元宇宙 实时渲染 实时云渲染 云VR

如何使用游戏引擎进行实时渲染和内容创建

3DCAT实时渲染

云计算 元宇宙 实时渲染 实时云渲染 云VR

Trending热榜关闭前,我把Github今年最火Java面试题汇总扒下来了

Geek_0c76c3

Java 数据库 开源 程序员 开发

借助iMazing工具重新安装或升级 iOS系统

淋雨

ios iphone

为了进大厂!吃透了各大厂最新 3000+Java 面试题啃完面试肯定妥了

Geek_0c76c3

Java 开源 程序员 架构 开发

好的,BFS,学会了

掘金安东尼

前端 9月月更

OptaPlanner快速入门-概述

积木编程

Java岗史上最全八股文面试真题汇总,堪称2022年面试天花板

Geek_0c76c3

Java 数据库 开源 程序员 开发

ESP32-C3 学习测试 蓝牙 篇(三、认识蓝牙 GATT 协议)

矜辰所致

蓝牙 ESP32-C3 9月月更 GATT

Apache APISIX 集成 Elasticsearch 实现实时日志监控

API7.ai 技术团队

elasticsearch API网关 APISIX 网关

全网首发!马士兵内部共享—1658页《Java面试突击核心讲》

Geek_0c76c3

Java 数据库 开源 程序员 开发

为什么3D实时渲染很重要

3DCAT实时渲染

云计算 元宇宙 实时渲染 实时云渲染 云VR

帮助中心案例分析|师爷,给我解释解释什么叫降本增效?

Baklib

降本增效 帮助中心

一加是OPPO的子品牌?我来说说我的看法

Geek_8a195c

首个专为半导体行业设计的开源大模型 SemiKong 问世_AI&大模型_赵明华_InfoQ精选文章