写点什么

首个专为半导体行业设计的开源大模型 SemiKong 问世

  • 2024-07-15
    北京
  • 本文字数:1035 字

    阅读完需:约 3 分钟

首个专为半导体行业设计的开源大模型 SemiKong 问世

7 月 10 日,国外初创公司 Aitomatic 宣布推出 SemiKong。这是世界上第一个专为半导体行业设计的开源 AI 大型语言模型(LLM)。它旨在通过将特定领域的知识纳入模型来解决半导体行业面临的一些挑战,例如有关半导体器件和工艺的物理和化学问题。



SemiKong 由人工智能联盟(AI Alliance)成员合作研发。AI 联盟成立于 2023 年,致力于构建、支持和倡导整个 AI 技术领域的开放式创新,包括软件、数据和模型、安全、安保和信任、工具、评估、硬件、教育、开放科学和宣传。


SemiKong 基于联盟成员 Meta 开源的 Llama3 模型,利用了包括 Tokyo Electron 在内的领先半导体公司和 FPT Software 等 AI 专家的专业知识。IBM 研究院 AI 开放创新负责人 Anthony Annunziata 强调,“SemiKong DRAFT v0.6 的诞生表明,汇集不同的专业知识能推动半导体制造等关键行业的重大进步。”


SemiKong 的训练过程主要分为 3 个主要阶段:预训练领域知识——自我微调(指令数据集)——合并和量化。从放出的代码权重,可以看出 SemiKong 有 8B 的参数。它在准确性、相关性和对半导体工艺的理解方面表现出了显著的进步。


Aitomatic 表示,即使是其较小版本,在特定领域的应用中也常常超越较大的通用模型,从而有可能加速整个半导体价值链的创新并降低成本。并且,它也为那些打造适合自身的专有模型的芯片公司提供了一个有价值的基座。



随着 SemiKong 降低半导体生产成本,消费者可以在未来几年内以更低的价格看到功能更强大的智能手机、笔记本电脑和智能家居设备。SemiKong 于 2024 年 7 月 9 日起在 HuggingFace 和 GitHub 上提供下载。下一个更强大的版本计划于 2024 年 12 月推出,预计 2024 年 9 月将推出首批特定工艺型号。


开源地址:https://github.com/aitomatic/semikong


SemiKong 项目的领导者, Aitomatic 首席执行官 Christopher Nguyen 表示:“SemiKong 将重新定义半导体制造业。这种开放式创新模式由人工智能联盟提供支持,利用集体专业知识应对行业特定挑战。在 Aitomatic,我们正在使用 SemiKong 创建领域特定 AI 智能体,以前所未有的效率解决复杂的制造问题。”


Tokyo Electron 高级专家、半导体行业模型的早期提出者 Daisuke Oku 补充道:“SemiKong 是半导体开源 AI 的一个令人激动的开始。Aitomatic 的创新方法有可能为我们的行业带来巨大的飞跃。”


参考链接:


https://www.prnewswire.com/news-releases/aitomatic-unveils-semikong-ai-breakthrough-set-to-reshape-500b-semiconductor-industry-302194215.html


https://www.semikong.ai/


2024-07-15 09:377391

评论 1 条评论

发布
用户头像
这个和RAG的技术路线区别是什么?
2024-07-15 10:38 · 湖北
回复
没有更多了
发现更多内容

泼辣修图2023最新版本修图工具功能介绍

茶色酒

泼辣修图2023

一文读懂 Zebec Chain 的“先行网络” Nautilus 链

股市老人

一文读懂 Zebec Chain 的“先行网络” Nautilus 链

鳄鱼视界

Ruby on rails入门

阿呆

ruby-on-rails

CrossOver2023永久版虚拟机软件下载

茶色酒

CrossOver2023

ByteHouse:基于ClickHouse的实时数仓能力升级解读

字节跳动数据平台

数据库 大数据 数据分析 Clickhouse 企业号 2 月 PK 榜

支撑MVP,架构师需要做什么

agnostic

MVP

学习算法必备的《程序员代码面试指南》免费领取啦!!

小小怪下士

编程 程序员 算法 LeetCode 数据结构与算法

一文读懂 Zebec Chain 的“先行网络” Nautilus 链

西柚子

自动驾驶过冬,需要点燃“降本增效”的炉火

脑极体

自动驾驶

状态机设计中的关键技术

timerring

FPGA

状态机设计中的关键技术

timerring

FPGA

SpringBoot 三大开发工具,你都用过么?

程序员大彬

springboot

Dromara HertzBeat 开源社区新晋两位 Committer

TanCloud探云

Java GitHub 开源 后端 开源社区

INFINI 产品更新啦 20230210

极限实验室

elasticsearch 极限实验室 极限网关 infini gateway INFINI Console

架构实战 6 - 电商微服务拆分

架构实战营 「架构实战营」

静态导航页设计与开发

码字与律动

团队管理 导航网站 vue next

五分钟实现pdf分页

程序员架构进阶

PDF 2月春节不断更 源码搭建 2月日更 pdfbox

由ChatGPT引发的关于AI的一些思考

xiaoboey

AI ChatGPT

DNS 原理及大规模高性能监测

郑州埃文科技

DNS

Camtasia2023Mac/win电脑屏幕录制编辑软件

茶色酒

Camtasia2023

10w+训练标签?成本太高!PaddleNLP情感分析赋能消费“回暖”

飞桨PaddlePaddle

paddle nlp 飞桨

在 JavaScript 如何下载文件

devpoint

JavaScript Blob download

Kubernetes环境cert-manager部署与应用

Galen Suen

Kubernetes TLS cert-manager Certificate Let's Encrypt

状态机设计中的关键技术

timerring

FPGA

微信客服接口的返回数据

HoneyMoose

贝叶斯AB测试

俞凡

最佳实践 ab测试

使用开源实时监控系统 HertzBeat 5分钟搞定对 Mysql 数据库监控告警

TanCloud探云

Java 数据库 GitHub 开源 数据库监控

微信 API 中调用客服消息接口提示错误返回限制

HoneyMoose

首个专为半导体行业设计的开源大模型 SemiKong 问世_AI&大模型_赵明华_InfoQ精选文章