写点什么

从虚拟学生“华智冰”到冬奥手语播报,人工智能大模型究竟还有多少可能性?

  • 2021-09-30
  • 本文字数:2258 字

    阅读完需:约 7 分钟

从虚拟学生“华智冰”到冬奥手语播报,人工智能大模型究竟还有多少可能性?

9 月 28 日,清华大学首位 AI 虚拟学生“华智冰”首次正脸亮相,并为大家带来一首歌曲,亮相视频中,“华智冰”是一名眉目清秀的女孩,表情动作也十分真实,视频一经发出,立马引起网友热议。那么“华智冰”到底是谁?


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    三个多月前的“2021北京智源大会”上,“华智冰”第一次出现在大众视野中,她基于超大规模智能模型“悟道2.0”诞生,具有丰富知识、与人类有良好交互能力,会创作音乐、诗词和绘画作品。这次“她”凭借一首弹唱成功圈了一波粉丝,也成为颇受喜欢的“网红”。

     

    “华智冰”的走红同时让“她”背后的世界最大的超大规模智能模型“悟道 2.0”再次受到大家关注。自“悟道 2.0”发布之日起,关于它怎么用起来就成为业界关心的热点话题。

     

    在本月 24 日,在智源研究院承办的 2021 中关村论坛“人工智能与多学科协同创新”平行论坛上,智源研究院学术副院长、清华大学教授唐杰公布了“悟道 2.0”应用的最新进展,并带来了两个最新应用案例。大模型时代的到来对于人工智能究竟有何意义?在会上,智源研究院院长黄铁军也给出了我们答案。


    “悟道”大模型落地实践

     

    本次创新成果展示主要围绕“悟道”开放平台及技术创新,包括:“悟道”大模型开放平台、大模型高效推理工具包 BMInf、全新升级的 AI 文图绘画大师 CogView 和实现大模型群聊的对话模型 EVA。

     

    • AI 工业化开发模式的“悟道”大模型开放平台,使得企业可以规模化、产业化地进行 AI 应用开发,降低了大模型开发门槛。

     

    • 大模型高效推理工具包 BMInf,实现了“一卡顶四卡”,支持在低配置的 NVIDIA GTX 1060 单卡机上运行百亿大模型,同时具备能力全面、应用便捷的优势。

     

    • AI 文图绘画大师 CogView 本次又取得重大升级,4 倍提速,4 倍清晰,实现图像生成品质与速度的双重突破。


     

    • 对话模型 EVA 实行开源上线,除特别善解人外,还具有大模型群聊功能,展望“人与物”交流的现在时代迈进到“物与物”交流的人机共融未来时态。

     

    同时针对大家关心的应用落地方面,唐杰教授为我们展示了两个 “悟道”大模型赋能产业的最新技术应用案例,分别为:“悟道”大模型与OPPO小布助手开启“生成式回答系统”以及基于智源“悟道”大模型的冬奥手语播报数字人。

     

    现阶段,从长尾问题来看,OPPO 小布助手以及整个 AI 语音回复行业普遍存在以下难点:

     

    • 单个问题命中率低、体量大且无法穷尽

    • 自建语料库周期长,人工数据标注成本高

     

    而这些问题也导致海量问题无法通过 AI 语音助手找到答案。针对这一行业痛点, 智源“悟道”大模型与 OPPO 小布助手合作,研发“生成式回答系统”,功能上线后将解决行业共通性的长尾问题,单条回答的建设成本降低 99%。



    对于此次与 OPPO 小布助手的合作,智源研究院黄院长也在会后采访中表示,“对于像 OPPO 这样的大企业,直接对接大模型并没有问题,但对于中小型企业,目前来讲可能还有难度,我们目标是希望有一天能让他们也可以简单、方便地用上大模型,用 AI 技术解决各行业应用场景中的具体问题。毕竟我们相信它有满足各类企业需求的潜力,只不过把潜力变成现实的中间还需要更多生态建设,悟道大模型正在朝着这个方向努力。”

     

    此外,本次论坛上我们还认识了一位“新朋友”——基于智源“悟道”大模型的冬奥手语播报数字人。“悟道”手语播报数字人将在北京冬奥会期间正式投入应用,它将提供全流程智能化的数字人手语生成服务,方便听障人士也能收看赛事专题报道,提升他们的社会参与度和幸福感。



    除了论坛上展示的两个应用案例,在黄院长看来,大模型的“通用智能”能力在医疗、金融、新闻传播等行业中同样具有非常大的应用前景。例如,在医疗健康领域,大模型在医疗数据格式化、病历自动解读与分析、自动问诊系统等都可以发挥巨大效用;在新闻传播领域,基于模型可实现智能新闻线索收集、机器写作、辅助编辑、虚拟主播等应用。

     

    因此通过以上对“悟道”应用生态的观察,我们不难发现,对于人工智能的发展来说,从“大炼模型”迈向“炼大模型”已经是大势所趋。那么大模型时代究竟有何意义?对于广大技术人员来说,又该以何种姿态面对其中的机遇与挑战呢?

    大模型时代的到来,意味着什么?


    驻足于让人工智能普惠各行各业的愿景上,黄院长曾说过:“之前全球形成了‘千村万户大炼模型’的热闹场面,但这种‘自家炼钢自己用’的作坊方式成本较高,显然不符合现代产业发展规律。而大模型泛化能力强,可以做到‘举一反三’,同一模型利用少量数据进行微调或不进行微调就能完成多个场景的任务,中小企业不需要招聘很多 AI 算法专业人员即可以进行应用开发,可以显著降低中小企业的研发门槛,促进 AI 技术的落地。”

     

    而今在思考“悟道 2.0”该如何用起来以及落地的实践过程中,黄院长以及科研团队对于大模型又有了更深刻的体会,“大模型就是把社会的各种数据资源、最强的算法以及算力整合在一起,变成公共基础平台”, 这也对大模型下一步的努力方向进行构想,即通用化、普及化、标准化。因此黄院长也在会上发出呼吁产希望学研能共同努力发展大模型,使其能更好地服务于各种应用。



    同时,面对大模型的诸多挑战技术人员更需不断创新进步。例如针对模态信息的理解和建模的统一问题,需要加入多模态的数据,比如文本、图片、视频等类型的输入,多模态的数据可以使得模型具备更多样的能力,以更好地应对各类下游任务,提高模型的“智商”。

     

    从多才多艺的中国首个 AI 虚拟学生“华智冰”到助力冬奥数字人,可以说,属于人工智能大模型的时代已经正式开启。对此,由黄院长领携的科研团队也向全社会广发英雄帖:欢迎各位有志之士加入到智源大模型的生态中来,为大模型研发的技术路线及应用构建等提供具体指导,为探索新一代人工智能发展提供助力。

    2021-09-30 14:092911

    评论

    发布
    暂无评论
    发现更多内容

    从零到一,教你搭建「CLIP 以文搜图」搜索服务(二):5 分钟实现原型原创

    Zilliz

    机器学习 深度学习 搜索引擎

    你的秋日好运正在派件,请查收9月月更活动!

    InfoQ写作社区官方

    热门活动 9月月更

    软件测试 | 测试开发 | app自动化测试(Android)--触屏操作自动化

    测吧(北京)科技有限公司

    自动化测试 app测试

    软件测试 | 测试开发 | Jenkins 集成 Android 代码检查

    测吧(北京)科技有限公司

    android jenkins

    上了NVMe的路,才能飙起全闪存的车

    脑极体

    虚拟机内存管理之内存分配器

    字节跳动终端技术

    vm 内存 虚拟机 内存管理 内存分配

    直播预告 | PostgreSQL 内核解读系列第六讲:PostgreSQL 索引介绍(下)

    阿里云数据库开源

    数据库 postgresql 阿里云 开源 polarDB

    程序员的摸鱼加速器!

    Liam

    程序员 前端 测试 后端 Postman

    一文看懂Mysql锁

    六月的雨在InfoQ

    MySQL MySQL锁 9月月更 Mysql死锁 Mysql锁粒度

    TDengine3.0计算查询引擎的优化与升级

    TDengine

    数据库 tdengine 时序数据库 企业号九月金秋榜

    从原理剖析带你理解Stream

    华为云开发者联盟

    开发 企业号九月金秋榜

    基于MonoRepo的Web端CI/CD实践与优化

    RingCentral铃盛

    企业号九月金秋榜

    设计模式的艺术 第二十章中介者模式练习(设计一套图形界面类库,包含若干预定义的窗格(Pane)对象,如TextPane、ListPane等,窗格之间不允许直接引用。基于该类库的应用由一个包含一组窗格的窗口(Window)组成,窗口协调窗格之间的行为)

    代廉洁

    设计模式的艺术

    从任正非的内部信,看系统开发公司如何度过寒冬

    CRMEB

    15款Python编辑器,你都使用过哪一款

    千锋IT教育

    Web3的流支付代表Zebec,熊市布局的价值逻辑

    鳄鱼视界

    软件测试 | 测试开发 | 测试人生 | 双非学历入职名企大厂还薪资翻倍?

    测吧(北京)科技有限公司

    面试 测试

    软件测试 | 测试开发 | 简单快速的从GitHub同步代码

    测吧(北京)科技有限公司

    git

    软件测试 | 测试开发 | 用 Pytest+Allure 生成漂亮的 HTML 图形化测试报告

    测吧(北京)科技有限公司

    pytest Allure

    边缘服务网格 osm-edge 概览

    Flomesh

    Service Mesh 服务网格

    YOLOX-PAI:加速YOLOX,比YOLOV6更快更强

    阿里云大数据AI技术

    深度学习 模型优化 企业号九月金秋榜

    构筑校园  “云资环”助力精准防控

    科技云未来

    软件测试 | 测试开发 | 疫情之下工资翻了2倍多,这4个月学习比工作8年学到的还多

    测吧(北京)科技有限公司

    软件测试

    华为云快成长直播ERP专场,以数据驱动企业智慧变革

    科技云未来

    一线技术人应该关注的四种思维能力

    阿里巴巴中间件

    阿里云 技术文章

    软件测试 | 测试开发 | app自动化测试(Android)-- Capability 使用进阶

    测吧(北京)科技有限公司

    Andriod

    软件测试 | 测试开发 | 测试人生 | 薪资翻倍涨至50W是种什么样的体验?

    测吧(北京)科技有限公司

    测试

    助力企业成就好生意,华为云快成长直播

    科技云未来

    软件测试 | 测试开发 | app自动化测试(Android)--高级定位技巧

    测吧(北京)科技有限公司

    xpath

    博睿数据携手亚马逊云科技,助您开启全链路可观测之旅

    博睿数据

    可观测性 智能运维 博睿数据 全链路 亚马逊云科技

    华为云WeLink直播助力高校毕业典礼:这届毕业生,我们云上嗨

    科技云未来

    从虚拟学生“华智冰”到冬奥手语播报,人工智能大模型究竟还有多少可能性?_AI&大模型_闫园园_InfoQ精选文章