【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

从虚拟学生“华智冰”到冬奥手语播报,人工智能大模型究竟还有多少可能性?

  • 2021-09-30
  • 本文字数:2258 字

    阅读完需:约 7 分钟

从虚拟学生“华智冰”到冬奥手语播报,人工智能大模型究竟还有多少可能性?

9 月 28 日,清华大学首位 AI 虚拟学生“华智冰”首次正脸亮相,并为大家带来一首歌曲,亮相视频中,“华智冰”是一名眉目清秀的女孩,表情动作也十分真实,视频一经发出,立马引起网友热议。那么“华智冰”到底是谁?


00:00 / 00:00
    1.0x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    三个多月前的“2021北京智源大会”上,“华智冰”第一次出现在大众视野中,她基于超大规模智能模型“悟道2.0”诞生,具有丰富知识、与人类有良好交互能力,会创作音乐、诗词和绘画作品。这次“她”凭借一首弹唱成功圈了一波粉丝,也成为颇受喜欢的“网红”。

     

    “华智冰”的走红同时让“她”背后的世界最大的超大规模智能模型“悟道 2.0”再次受到大家关注。自“悟道 2.0”发布之日起,关于它怎么用起来就成为业界关心的热点话题。

     

    在本月 24 日,在智源研究院承办的 2021 中关村论坛“人工智能与多学科协同创新”平行论坛上,智源研究院学术副院长、清华大学教授唐杰公布了“悟道 2.0”应用的最新进展,并带来了两个最新应用案例。大模型时代的到来对于人工智能究竟有何意义?在会上,智源研究院院长黄铁军也给出了我们答案。


    “悟道”大模型落地实践

     

    本次创新成果展示主要围绕“悟道”开放平台及技术创新,包括:“悟道”大模型开放平台、大模型高效推理工具包 BMInf、全新升级的 AI 文图绘画大师 CogView 和实现大模型群聊的对话模型 EVA。

     

    • AI 工业化开发模式的“悟道”大模型开放平台,使得企业可以规模化、产业化地进行 AI 应用开发,降低了大模型开发门槛。

     

    • 大模型高效推理工具包 BMInf,实现了“一卡顶四卡”,支持在低配置的 NVIDIA GTX 1060 单卡机上运行百亿大模型,同时具备能力全面、应用便捷的优势。

     

    • AI 文图绘画大师 CogView 本次又取得重大升级,4 倍提速,4 倍清晰,实现图像生成品质与速度的双重突破。


     

    • 对话模型 EVA 实行开源上线,除特别善解人外,还具有大模型群聊功能,展望“人与物”交流的现在时代迈进到“物与物”交流的人机共融未来时态。

     

    同时针对大家关心的应用落地方面,唐杰教授为我们展示了两个 “悟道”大模型赋能产业的最新技术应用案例,分别为:“悟道”大模型与OPPO小布助手开启“生成式回答系统”以及基于智源“悟道”大模型的冬奥手语播报数字人。

     

    现阶段,从长尾问题来看,OPPO 小布助手以及整个 AI 语音回复行业普遍存在以下难点:

     

    • 单个问题命中率低、体量大且无法穷尽

    • 自建语料库周期长,人工数据标注成本高

     

    而这些问题也导致海量问题无法通过 AI 语音助手找到答案。针对这一行业痛点, 智源“悟道”大模型与 OPPO 小布助手合作,研发“生成式回答系统”,功能上线后将解决行业共通性的长尾问题,单条回答的建设成本降低 99%。



    对于此次与 OPPO 小布助手的合作,智源研究院黄院长也在会后采访中表示,“对于像 OPPO 这样的大企业,直接对接大模型并没有问题,但对于中小型企业,目前来讲可能还有难度,我们目标是希望有一天能让他们也可以简单、方便地用上大模型,用 AI 技术解决各行业应用场景中的具体问题。毕竟我们相信它有满足各类企业需求的潜力,只不过把潜力变成现实的中间还需要更多生态建设,悟道大模型正在朝着这个方向努力。”

     

    此外,本次论坛上我们还认识了一位“新朋友”——基于智源“悟道”大模型的冬奥手语播报数字人。“悟道”手语播报数字人将在北京冬奥会期间正式投入应用,它将提供全流程智能化的数字人手语生成服务,方便听障人士也能收看赛事专题报道,提升他们的社会参与度和幸福感。



    除了论坛上展示的两个应用案例,在黄院长看来,大模型的“通用智能”能力在医疗、金融、新闻传播等行业中同样具有非常大的应用前景。例如,在医疗健康领域,大模型在医疗数据格式化、病历自动解读与分析、自动问诊系统等都可以发挥巨大效用;在新闻传播领域,基于模型可实现智能新闻线索收集、机器写作、辅助编辑、虚拟主播等应用。

     

    因此通过以上对“悟道”应用生态的观察,我们不难发现,对于人工智能的发展来说,从“大炼模型”迈向“炼大模型”已经是大势所趋。那么大模型时代究竟有何意义?对于广大技术人员来说,又该以何种姿态面对其中的机遇与挑战呢?

    大模型时代的到来,意味着什么?


    驻足于让人工智能普惠各行各业的愿景上,黄院长曾说过:“之前全球形成了‘千村万户大炼模型’的热闹场面,但这种‘自家炼钢自己用’的作坊方式成本较高,显然不符合现代产业发展规律。而大模型泛化能力强,可以做到‘举一反三’,同一模型利用少量数据进行微调或不进行微调就能完成多个场景的任务,中小企业不需要招聘很多 AI 算法专业人员即可以进行应用开发,可以显著降低中小企业的研发门槛,促进 AI 技术的落地。”

     

    而今在思考“悟道 2.0”该如何用起来以及落地的实践过程中,黄院长以及科研团队对于大模型又有了更深刻的体会,“大模型就是把社会的各种数据资源、最强的算法以及算力整合在一起,变成公共基础平台”, 这也对大模型下一步的努力方向进行构想,即通用化、普及化、标准化。因此黄院长也在会上发出呼吁产希望学研能共同努力发展大模型,使其能更好地服务于各种应用。



    同时,面对大模型的诸多挑战技术人员更需不断创新进步。例如针对模态信息的理解和建模的统一问题,需要加入多模态的数据,比如文本、图片、视频等类型的输入,多模态的数据可以使得模型具备更多样的能力,以更好地应对各类下游任务,提高模型的“智商”。

     

    从多才多艺的中国首个 AI 虚拟学生“华智冰”到助力冬奥数字人,可以说,属于人工智能大模型的时代已经正式开启。对此,由黄院长领携的科研团队也向全社会广发英雄帖:欢迎各位有志之士加入到智源大模型的生态中来,为大模型研发的技术路线及应用构建等提供具体指导,为探索新一代人工智能发展提供助力。

    公众号推荐:

    2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

    AI 前线公众号
    2021-09-30 14:092514

    评论

    发布
    暂无评论
    发现更多内容
    从虚拟学生“华智冰”到冬奥手语播报,人工智能大模型究竟还有多少可能性?_AI&大模型_闫园园_InfoQ精选文章