NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

国内首家 IC 上云企业 嘉楠科技谈如何实现开发成本最小化

  • 2019-08-23
  • 本文字数:3589 字

    阅读完需:约 12 分钟

国内首家IC上云企业 嘉楠科技谈如何实现开发成本最小化

随着产业链分工细化,IC 目前已发展出 IDM、IP 设计和 Fabless 三种主流开发模式。虽然今天的芯片研发门槛不断降低,但是在经典 IC 开发环境中,企业仍然面临计算资源缺乏、存储瓶颈等限制。作为国内首家 IC 上云企业,嘉楠科技选择在云端部署 IC 研发平台,HPC 管理,自建存储及优化,极大缩短开发周期,率先开启了国内 IC 上云的风潮。


8 月 16 日,由中科院微电子所、Fabless IT 社群主办,嘉楠科技承办的"集成电路 IT 技术研讨之云时代下的芯片设计暨 Fabless IT 走进嘉楠科技活动”在京举行。来自国内明星 IC 设计企业的 Fabless IT 从业者共聚嘉楠,围绕开源软件、IC 研发平台架构、集群调度技术等热门话题展开深入探讨,嘉楠科技还分享了 IC 设计上云方面的成果和经验。



Fabless IT 社群成员共聚嘉楠科技


说到Fabless,实际上是Fabrication(制造)+less,即"不做制造,专注设计"的IC设计模式。但随着芯片应用场景扩展和精细化,即使在经典的 IC 开发中,也面临EDA峰值性能需求难以被满足等一系列问题。因此,拥有灵活部署算力、可扩展迭代和数据安全存储等优势的云计算在芯片开发等领域存在广阔的应用价值。

嘉楠科技王轩哲:“上云可以让 IC 开发成本最小化”

作为本次活动的东道主,嘉楠科技高级工程师王轩哲在《高性能云计算服务在芯片设计领域的实践》的主题演讲中,从云计算优势、云上基础设施设计维护管理、云上与线下安全、云上 HPC 构建管理、自建存储优化与管理等层面分享了嘉楠科技在 IC 设计上云“第一次吃螃蟹”的经历。


IC 开发上云以后,开发者不需要考虑资源缺乏和复用等问题,管理者只需要关注业务本身的资源、人力和 EDA 成本。“上云可以让 IC 开发成本最小化”,王轩哲举了一个的例子来说明云端的“资源优势”:去年西数的一个项目通过上云,实现了 100 万颗 CPU 的调度,从而将该项目周期从月度缩短为 8 小时,实现了更为敏捷高效的 IC 开发。



嘉楠科技网络架构


在经典 IC 开发环境中,IC 团队和 IT 团队都面临着 EDA 峰值性能需求难以被满足;数据迁移,耗时费力;多项目并行导致资源抢夺,影响项目进度;运行时间长达数周的 EDA 进程因停电等外力因素中断;异地办公图像卡顿,以及数据安全等一系列问题的挑战。嘉楠科技通过代码描述、周期化管理、一次完成设计 &版本迭代回溯 &周期更新。“一个人管理一个全球化的私有网络”,王轩哲这样形容云端生产力的强大。


信息时代,数据安全是企业安全的底线,线上线下须统一设计规划管理。嘉楠科技从网络安全、存储安全、密钥安全等维度构建云上和线下安全体系,从而让客户明确当前核心数据安全情况以及使用授权时的二次认证或交叉真人应用类型,保证每次数据使用可查可控可信,保障 IC 开发上云的数据安全。其中,企业又该如何在云上数据管理中最大限度地利用资源呢?


王轩哲回答,企业需要一个完整的实例监控系统,最好能做到秒级的性能状态跟踪;同时需要一个日志处理系统,一方面满足审计的需求,一方面满足企业对错误状态的跟踪;除此之外,还需要改进旧有的开发方式从而节约流量开销。


基于此,嘉楠科技建立了云上性能分析和性能预警系统。如下图所示,嘉楠科技使用 Prometheus 技术栈定制采集所需各类监控信息的 node_export、netdata 与各类插件,并使用 Grafana 进行数据展示,同时进行告警、状态日志收集。



HPC(High Performance Computing) 是指利用计算能力来处理标准工作站无法完成的数据密集型计算任务。使用 MPI、OpenMP 或其他类型的并行库、作业数组和复杂的依赖性工作。


HPC 在 IC 开发上应用广泛。嘉楠科技通过各类调度器统一集成、制定流程方案等开展云上 HPC 构建管理,降低跨供应商 HPC 任务周期内实际成本;通过监控记录统计信息收集整理为任务模板,精准匹配 HPC 集群;研发自管理,解决出现垃圾 job 时资源缺乏和任务抢占等问题。


针对现在 IC 企业普遍面临的存储瓶颈,王轩哲从“监控先行、任务分析、通用场景模板”等讲述嘉楠科技自建存储优化与管理的历程。传统的工作负载生成器软件(如 Iometer 或 Vdbench)与其非本机操作系统的兼容性有限,或者它们难以为高性能存储设备如 RDMA/nfs/pcie/nvme 进行测试。 嘉楠科技选择基准测试工具来准确测量不同存储产品的性能。流程上首先分析驱动器在彻底预处理阶段的执行方式,使用供应商的工具安全地擦除每个可比较的产品。然后在相同的工作负载下预处理稳定状态,在 32 个线程(每个线程的队列为 32 个)的重负载下测试设备,进而完成整个过程。


通过周期性监控记录回收确认最适合嘉楠科技 EDA 任务使用场景的存储集群,其存储从一次性定点支出升级成周期性和单个任务绑定,从而 10 倍提升存储系统性能,大幅节约商用存储成本。

众专家热议 Fabless IT 行业热点

在随后的嘉宾分享环节,IC 极客/观柘科技创始人、“国内第一女 CAD”高艳丽(Alice Gao)在其《企业级 IC 研发平台构建》的主题演讲中,展示了包括基础设施、EDA 工具、流程、方法学、工程管理、资源及环境的 IC 研发平台的分层架构。


其中,HPC 层提供硬件、网络、信息安全和虚拟化服务。运维管理层提供终端服务,包括数据部署、集群管理、作业管理等。工具层主要涉及 EDA 工具、管理工具、环境及 License 管理。而 CAD 层聚焦实现下列内容:


  • IC 数据,环境,流程,设计及结果容器化,信息化管理,在 multi-site、multi-project、multi-task、multi-user 的协作管理中,提升基线,持续优化工程效率。

  • 基于版本管理、信息化管理、全配置管理及经验代码化,快速建立项目及 EDA 作业环境,在设计分析阶段,提升并行作业的能力及可移植性,并针对批量作业结果做统计分析,加速设计收敛。

  • 将度量体系内置于数据管理和流程构建,提升知识及经验代码化及可复用性,持续优化工程质量。


随后,Alice 通过梳理 IC 设计过程,以标准化、模块化和结构化的方式连接 EDA 工具链及流程,项目管理及运维管理。并介绍了 IC 研发平台成熟度模型。并结合企业级 IC 环节交付复杂、IC 数据类别多体量大、研发平台构建标准难统一等痛点,从业务视角对适配云思路的 IC 设计上云路径提出了实施建议。


Alice 认为,企业应持续优化质量和效率,将最大化 IC 研发投入 ROI。同时,企业应保持全局化、代码化、可视化三项原则构建企业级 IC 研发平台。


  • 全局化:EDA 流程环节整合优化,聚焦交付;跨部门跨环节沟通协作更顺畅;更好评估需求变更及插队任务。

  • 代码化:研发经验代码化;利用架构思维,避免重复造轮子;流程代码内建质量体系和度量标准。

  • 可视化:简单直观的研发过程引导;进度、等待、返工、浪费及数据质量实时(授权)真实可见;减少心口相传的管理及技术交流。


常青藤开源科技有限公司 CEO 黄迎春进行了《基础设施开源软件及其在 IC 运维领域的应用》的主题演讲。黄迎春从一张描绘持续演进的数据中心架构图,分别对 Linux、虚拟化平台、私有云 IaaS 平台、软件定义存储、容器化技术、自动化运维工具、系统自动化安装、系统监控、数据分析和可视化软件、统一账户管理软件等方面详细介绍了开源软件在基础运维层面的应用情况。并介绍其对于 IC 领域 IT 运维的理解,以及在 IC 运维领域推荐的开源软件和解决方案。


运算集群建立是 Fabless 公司进行高性能计算的基础,集群资源调度优化和效率提升是充分发挥集群计算效能的关键。某 CAD 专家在其《利用开源工具提升集群调度和管理的效率》的演讲中,结合 OpenLava、Jenkins、Django、MySQL 等开源工具,介绍如何搭建一个可供用户自查,实现自动化和可视化的平台的关键核心点——通过数据的分析方法体现对设计流程的理解。与会嘉宾出于各自从业经历,纷纷表示对使用开源工具将多个工具集成起来应用的巨大效能表示赞同。


此次活动吸引了 30 余名来自中科院微电子所和北京主要 IC 设计公司的 Fabless IT 社群成员参加。大家从云计算、CAD 技术、IT 运维、信息安全等专业领域,畅谈云时代的 IT/IC 行业热点和产业趋势,并高度评价此次嘉楠科技承办的 Fabless IT 主题活动。


在活动最后,本次活动的主要发起者、Fabless IT 社群负责人张书波总结到:随着集成电路行业成为国家核心基础行业,不断有新 IT 技术被引入 IC 行业。这也为广大 Fabless IT 从业者们提供了时代机遇。张书波倡议大家坚持“共享、互助、钻研、进步”,共同拓展 IT/CAD 影响力,以 IT 技术助力 Fabless 发展,共助中国芯的实现!


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-08-23 14:145377
用户头像
孙春鹭 InfoQ 编辑

发布了 27 篇内容, 共 10.4 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

ThingJS粒子特效一键实现雨雪效果

ThingJS数字孪生引擎

可视化 场景应用 3D可视化 数字孪生

Alibaba面试官:“这该死的程序员,技术竟如此深厚!”

Java架构之路

Java 程序员 架构 面试 编程语言

高德地图只显示一个省的地图

孤独的西北疯

DWF低代码开发技术及其在数字化运营和运维平台建设中的应用

云智慧AIOps社区

低代码 智能运维

学到了,用138个案例讲明白了Spring全家桶+Docker+MQ

Java架构师迁哥

助力秋招第三弹:Java集合框架体系详细梳理

北游学Java

Java 面试 框架 秋招

大厂面试内幕:阿里内部整理出的5000页Java面试复盘指南,起飞

Java架构追梦

Java 架构 面试

国家工业信息安全发展研究中心与华为联合发布《数据安全白皮书》

DT极客

爱了! Alibaba技术官甩出的“阿里内部Java成长笔记”,技术人成长的标杆!

Java架构之路

Java 程序员 架构 面试 编程语言

关于echarts使用geo制作地图tooltip不显示问题

孤独的西北疯

扫盲篇-什么是分布式任务调度

TASKCTL

大数据 分布式 分布式锁 分布式任务调度 zookeeper分布式锁

GitHub连夜封杀!这份阿里 10W 字内部 Java 字面试手册到底有多强?

Java 程序员 架构 面试

区块链如何赋能企业数字化转型?

CECBC

CCF C³-04@百度丨“AI+开源”的昨天今天和明天

百度大脑

百度 AI

Spring Boot Devtools Restarter 原理

sN0wpeak

Java spring

中国数字人民币官方宣传片来袭!DCEP:开启“无现金新时代”!

CECBC

阿里P7简历上都有哪些可以拿得出手的项目?

Java架构师迁哥

微服务注册中心:Consul——服务注册

程序员架构进阶

微服务 Consul API网关 28天写作 5月日更

C++ 协程的近况、设计与实现中的细节和决策

Linux服务器开发

c++ 线程 后端 协程 Linux服务器开发

备战 60 天,成功上岸滴滴后,我特地把金三银四备战资源库整理出来了

Java 程序员 架构 面试

发布引发的curator报错:instance must be started before calling this method

林一

dubbo zk 优雅停机

人生算法:做好自己这家公司的CEO

石云升

读书笔记 思维模型 5月日更

阿里开源:历年亿级活动高并发系统设计场景总结

Java架构师迁哥

外包CRUD3年,被导师一句话点醒,直接涨薪9K(Java岗)

Java架构师迁哥

CompletableFuture 简单与链式的区别?

码农架构

Dubbo 服务治理简介

青年IT男

dubbo

一周信创舆情观察(5.17~5.23)

统小信uos

GitHub上标星75k+超牛的《Java面试突击版》,分享PDF离线版

Java 程序员 架构 面试

一个月吃透这份阿里高级专家的《Java500道面试手册》成功拿下了腾讯offer!

Java架构之路

Java 程序员 架构 面试 编程语言

阿里人是如何设计系统抵挡亿级流量冲击的?(全彩版小册开源)

Java架构师迁哥

吐血总结 | Java并发编程 72 变

Java架构师迁哥

国内首家IC上云企业 嘉楠科技谈如何实现开发成本最小化_语言 & 开发_孙春鹭_InfoQ精选文章