AI 年度盘点与2025发展趋势展望,50+案例解析亮相AICon 了解详情
写点什么

北大 AI 公开课 2019 | 好未来杨松帆:为人工智能时代打造 AI 老师

  • 2019-04-21
  • 本文字数:7286 字

    阅读完需:约 24 分钟

北大AI公开课2019 | 好未来杨松帆:为人工智能时代打造AI老师

4 月 17 日,备受瞩目的北大 AI 公开课第五讲如期开讲,好未来 AI 业务负责人杨松帆带来了《为人工智能时代打造一个 AI 老师》的分享,就人工智能时代的教育展开深入的讨论和交流。


北京大学最受欢迎的 AI 公开课“人工智能前沿与产业趋势”于 2019 年 2 月 20 日正式开课。本学期的课程邀请到了商汤科技副总裁沈徽、驭势科技 CEO 吴甘沙、微软亚洲研究院副院长周明、360 人工智能研究院院长颜水成、YC 中国创始人及 CEO、百度集团副董事长陆奇等 14 位来自产业界的大咖进行授课,AI 前线作为 独家合作媒体 将全程跟进并对北大这 14 场公开课进行整理,敬请关注!



课程导师:雷鸣, 天使投资人,百度创始七剑客之一,酷我音乐创始人,北大信科人工智能创新中心主任,2000 年获得北京大学计算机硕士学位,2005 年获得斯坦福商学院 MBA 学位。



特邀讲师:杨松帆,好未来 AI 业务负责人。曾任情绪计算技术公司 FaceThink 创始人兼 CEO。美国加州大学河滨分校博士,美国加州大学尔湾分校博士后;曾任四川大学副教授;中组部“千人计划”(四川)特聘专家,主持国家自然科学基金项目。曾就职于美国暴雪娱乐总部,担任数据科学家。于 2011 年获 IEEE 国际人脸表情识别挑战赛第一名,战胜包括麻省理工学院,卡耐基梅隆大学,牛津大学等 13 支世界顶级科研团队。


北大 AI 公开课第八讲回顾:《最受欢迎北大AI公开课!360集团颜水成:人工智能行业观察与实践


以下为 AI 前线独家整理的杨松帆老师课程内容(略有删减)。


今天我带来的演讲是《为人工智能时代打造一个 AI 老师》,主要内容是关于 AI 教育这个话题。首先,我想先和大家探讨一个思考框架,然后尝试用这一个底层的思考模型帮助来听讲座的各位解答一些在不同阶段可能会遇到的问题和困惑,比如教育行业为什么需要人工智能,创业时如何判断项目靠不靠谱等。


用“价值升维模型”来解答上述问题


首先,我们要了解价值的概念。什么是价值?通俗地讲,就是有人愿意为其买单,买单的原因多种多样,包括商业价值、历史价值、文化价值等。价值往往在其更高一个维度得到体现。在座的大多都是学习科学技术的学生,那我们就先从技术这个维度开始推演。


绝大部分的技术都延续一个价值链的传递,那就是在产品中落地。正是由于技术解决了产品中的某一个重要的问题,所以技术的价值才最终体现在了产品里。而产品要关注的方面非常多,技术只是其中一个,其他的还包括用户场景、需求和设计交互等。如果其中一个部分做得不好,会导致整个产品的价值发挥不出来,那其中的技术的价值也就发挥不出来。大家应该见过不少非常牛的技术因为应用场景不对,而无法被大规模的使用并发挥价值,这是我们做技术的伙伴都不愿意看到的。

价值升维模型是什么?


如果把这个过程抽象成一个模型,维度 1(Rank1)是我们刚刚讨论的技术的价值,而在 Rank2 里我们上升了一个维度,说明了要让技术发挥价值,就需要帮助产品解决问题,让产品实现其价值。而产品要发挥价值,就得升一维思考,帮助解决企业的问题:如何产生业务闭环,在市场中获得回报,产生商业价值。



如果我们用概率图模型表示价值升维模型,它可以像上图一样表示:有 M 个 Rank(K)的 Value,同时还有 N 个关于 Rank(K+1)的其他因素,共同决定了 Rank(K+1)的价值是否能实现。我们可以把它拆开,看看这个链条到底有多长。



刚刚说到产品价值体现在它如何帮助企业实现发展,而企业要持续发展,最终实现其价值,则必须要站在行业的角度思考,解决行业的问题。在行业这个维度,会涉及到行业的生态、趋势、标准等等。而行业要实现其价值,必须要升维,思考和解决国家的问题。最终,一个国家要持续发展,则需要站在更高一个维度,即人类文明的角度,去持续解决问题。


我们每个人在当下正在解决的问题的维度不同,但无论哪个维度,我们都追求一个共同目标:可持续发展。那么如何实现每个维度的可持续发展呢?我认为就是在解决当前维度的问题时,尝试着升维思考,看看如何帮更高一个维度解决问题。举个例子,我团队里的技术小伙伴常跟我说:“松帆,我搞出了个技术特别厉害,如何如何牛。”我经常会反问说这个技术怎么用到产品里,他就乐了。或许他就没有想过这个技术是如何实现了产品的价值,这就会让我担心,会考虑是否还持续的让这个伙伴做这个技术。因此他在思考技术这个维度时,可持续发展便受到了威胁。如果他能讲清楚这个技术如何在产品里使用,最终发挥更大的企业价值,那我根本不用担心,大胆的让他放手去研究这个技术,因为他已经考虑得很周全了。


我认为,不升维思考是桎梏,升一维思考是本分,升两维思考是精进。


另外有一点我需要说明,这个模型里还有一个价值链传递方向,是从技术价值直接传递到了国家价值。这是指国家会通过自然科学基金等形式,为技术的创新投入资源,因为科技实力对一个国家来说是至关重要的。而反过来讲,对于实现这类技术价值的人(大多是科研工作者),如果要追求可持续发展,绝非仅仅考虑如何完成科研课题本身,而是得好好思考如何才能解决国家的问题,乃至人类文明的问题。

用价值升维模型解决问题

下面我选择几个大家关心的问题用价值升维模式来解答,比如第三个问题:导师为什么偏爱那个同学而不是我?


导师要考虑的问题很多,比如获得基金的资助,如何产出具有影响力的科研成果等。站在导师的角度考虑,他对每个学生都有一个很重要的诉求:“是否可以帮助解决我最关注的问题。”如果你能够站在导师的角度帮助他解决问题,你的能力非常优秀,同时他对你会非常信赖。我的建议是,如果导师在寻求基金,你需要学会写基金申请书;如果基金充足,你就从导师的课题方向里选择一个你最感兴趣且最擅长的方向,做出世界级的科研成果;最后,格局大一点,带动你实验室的其他学生,也一起用这样的思维方式思考问题。


用价值升维模式来回答第六个问题:如何判断项目靠不靠谱?


这个问题分两方面。如果你是创始人,你得想清楚你是在解决哪个 Rank 的问题。聚焦用户需求固然重要,创业也需要做减法,但是如果只能考虑产品维度的问题,则是难以持续的。创业是在解决企业维度的问题,就必须要站在行业甚至国家的维度,看看它们需要解决什么问题。比如选择创业的这个行业趋势是不是向上,有没有在帮助国家解决某个问题,这样,你才能吸引一堆牛人和你共同创造价值,最终实现自我价值。如果你是联合创始人,也同样适用以上标准,如果解决的问题足够有意义,并且牛人扎堆,你可以考虑加入。

教育行业为什么需要人工智能?


现在,我们一起解答下第一个问题:教育行业为什么需要人工智能,以及好未来在其中做了什么。


我们先来看一位优秀的老师应该是怎样的?一般来说能够做到教学、诊断、答疑已经算很好的老师了,对于这样的老师,他的角色更像是 Lecturer 或者 Tutor。但这不够,我们还希望老师能关注每个人,比如每个学生的兴趣、认知、发展,能够唤醒、激发、鼓舞每个学生,这样的角色更像 Mentor 或 Coach。但这对老师的要求极高,优秀的老师本来就极度匮乏了,很难要求老师还能兼顾这么多的能力。


当下,我们正高速迈向 AI 时代,AI 时代会诞生一次新的工业革命,其标志就是在全行业大规模出现人和机器的再分工。我经常会被问到这样的问题:AI 老师何时替代人类老师。我认为,AI 老师是帮助人和机器再分工,并不是替代老师,它能够分担部分任务,解放老师的生产力,进而让老师能更好地专注于教学研发和教学方法设计,能够更加关注唤醒、激发和鼓舞学生。


在当今教育资源分布不均的情况下,我们希望通过科技把一个老师搬到任何地方,比如好未来在做的 AI 双师课堂就是一个例子:一个主讲老师通过大屏幕授课,班里还会有一个辅导老师保障课堂的顺利进行,组织学生们参与预习和练习,并给予学生更多的关怀和鼓励。



屏幕里就是我们 2017 年开始做的一个具有真人形象的 AI 老师项目,它可以通过摄像头、麦克风等传感器进行人脸、动作和语音等多维度的识别,这个 AI 老师可以根据每个班级学生的现场表现做出针对性的反馈,比如点名提问,识别判断学生的回答是否准确,并给予相应的反馈。同时,AI 老师还能实时调整授课节奏,如果有一道题同学们普遍掌握的不好,他会详细讲解;如果一个概念大家都清楚,他就会一笔带过。我们通过技术,提前准备好老师的互动授课内容,然后将优质师资输送到每一间教室。


与此同时,我们也做了英语科目的 AI 老师。在偏远地区,外教的资源非常匮乏,AI 老师能够发挥巨大的价值,给每个地方都带去优质的英语教育资源。课堂上,每个学生手持答题器,开口说英语,答题器可以收集学生的语音,并进行语音的识别和评分,AI 老师会根据每个人的回答给出针对性的反馈。

背后的技术支撑

在教室里让 AI 老师流畅而自然的讲课,背后涉及非常多的技术,其中包括大量的 AI 算法,比如中英文语音识别、情感分析、流利度分析、人脸识别、表情识别、文字识别、图片搜索、语义分析和语义情感等。因为教育行业场景的特殊性,需求和对应的数据各异,因此对相关技术的要求也不尽相同,通用的 AI 模型并不能很好的直接解决问题。



教室里的 AI 老师这个产品,符合边缘计算的范式。我们需要对上课时的数据在现场进行实时处理,而不是通过强大的网络把数据传到后端的云计算中心,处理后再返回决策。然而,边缘计算存在诸多挑战,如场景是否可控,算力是否足够等等。比如在手机终端,由于算力和网络传输的限制,很多产品都还停留在概念和实验室阶段。


参考之前的升维模型,如果抛开产品价值,只闷头考虑技术,这是不可持续的。相较于其他行业来讲,教育场景对 AI 的产品化落地非常友好:教育场景通常是可控的,比如教室内的灯光等;同时用户比较愿意配合。这让 AI 技术得以很好的落地,比如我们的 AI 模型可以在课堂上对面部和身体的关键点进行检测跟踪,识别头部姿态、面部表情和肢体动作等等,然后将数据传到本地的大脑(处理器)进行计算,AI 老师就可以知道课堂正在发生什么,比如谁在举手,进而根据一系列信息进行决策,比如接下来应该请哪位同学来回答问题。



虽然教室内的场景足够友好,但我们也经历了长时间多版本的技术优化和迭代。以举手识别这个技术点为例,我们关注的有两个关键指标,一是准确性,即 mAP(mean average precision),二是计算时间开销,即 Time  Cost;我们希望模型越来越准,而时间开销越来越低。在第一个版本中,我们用了 Faster  RCNN 作为基线模型,发现 mAP 很低,只有 0.65,速度也很慢,单帧处理超过 2 秒。我们分析后发现,训练数据是在夏天收集的,学生穿的短袖(上图左一),等到冬天(上图左二),我们发现识别率骤降,这是因为数据 bias 导致的。于是在第二阶段,我们收集了更多数据,更换了网络,这样曲线就按照我们的预期方向迭代,处理时间下降了很多,mAP 也提升了 15 个百分比。这时,我们相对准确地检测到举手同学的边框。


接下来,我们又做了一系列优化,进行了 5 个版本的迭代,包含了 Anchor  Aspect  Ratio 优化、ROI Align,以及很多工程加速等,最终实现了超过 0.9 的 mAP,而耗时只有不到 20 毫秒,达到了产品体验的要求。

用 AI 带来大规模的高品质、个性化教育

好未来希望通过 AI 助力教育达到两个目标:一是对个体而言,好未来希望带来更高品质的教育,让教育更个性化,真正能够激发学生的学习兴趣,让每个人都有自己好的未来;第二就是让教育资源更加公平,让优质的资源更加容易被获取,用科技推动教育进步。



回到价值升维模型,总的来说,人的成长和发展,意味着他/她能逐渐去解决更高维度的问题。而解决教育的问题意义重大,在价值升维模型里的维度很高,不仅需要考虑对教育行业的价值,还要思考国家价值以及人类文明价值。这对每个教育行业的从业者来讲,都是有极大成就感的。

尚在解决的问题

现在其实还有很多问题尚待解决,期待大家和我们一起解决,这里列出其中三个我们还没能很好解决的问题:


第一个问题,如何让每一个学生都拥有私人定制的 AI 老师?


这个问题暂且先抛开教学内容不谈,只考虑老师的形象,学生对于老师形象的喜好差异很大,有的学生喜欢睿智的爱因斯坦当自己的老师,有的学生喜欢漂亮的女老师,年龄小点的学生可能更喜欢卡通形象的老师。这个问题的难点在于,我们希望大规模的定制 AI 老师,实现其动作可迁移,即一个形象做的动作能够被另一个形象复制,同时还要考虑用户体验,做到动作自然。


第二个问题是如何快速生成课件?


一位老师一年可能会生成几十,甚至上百页的课件,供上课时使用。因此,保守估计,全国的老师一年要诞生百亿级别的课件。一个好的课件,不仅需要制作者有对教学内容的专业见解,还需要其具备较好的审美,专业而好看的课件更能激发孩子学习的动力,这就对老师提出了比较高的要求。如果能有一个系统,在老师输入关键元素之后,自动生成美观并且定制风格的课件,不仅能解放老师的精力,还能大规模地提升课件的质量。这个问题很难,但我希望能解决这个问题,赋能所有的老师,这是非常有价值的。


最后一个问题,就是如何平衡学生在做题时的成就感和挑战欲?


学生在做练习题时,会因为题目太难产生挫败感,也会因为题目太简单而感到无聊。通过合理的难度设置,在保证学生成就感的同时,又不断激发其挑战欲,是一个非常困难的问题。在解构完这个问题后,我们认为可能需要一个 AI 练习系统,它能够预测学生做一道题的准确率。这完全是从教育的本质出发,先要思考如何激发学生对于做题的兴趣,关注他们的成就感,然后才是预测学生掌握知识的程度,进行千人千面的题目推荐。我们目前有一些初步的想法,但这确实是一个非常有挑战性的问题。


总结一下,在座的各位小伙伴都享受了教育的红利,而教育里面还有很多很有价值的问题需要被解决,我希望各位在享受到教育的红利之后,能够回馈教育,共同来推动国家和人类社会的可持续发展。

雷鸣对话杨松帆

雷鸣:现在 AI 高考热度很高,对此你的观点是什么,比如 AI 怎么去做题?AI 高考研究对教育有意义和价值吗?AI 参加高考真的能考到北大、清华?


杨松帆:大家总认为 AI 对我们充满了无限的威胁,它可以包罗万象,无所不能,尤其是经历 AI 围棋超越人类,AI 电竞超越世界冠军等事件后,大家对 AI 有了无限的憧憬,觉得对于明确的任务,AI 都可以搞定,但实际并非如此。我们也做过 AI 高考的研究,AI 现在能解决绝大部分的选择题,原因是我们可以让 AI 把各个答案选项直接代到题目里去,看是否存在矛盾。对于 AI 解答开放型的题目,比如证明题、应用题等等,短期还没有比较成熟的解决方案,但从长期来看,我还是持相对乐观的态度,一是因为我们能结构化题目和答案,二是我们有规模化的答题数据与判卷数据。


雷鸣:未来,个性化教育的发展最大的挑战在哪里?AI 可以做什么?


杨松帆:个性化是一个永无止境的话题,背后的价值链很长,对于教育也非常重要。我们需要首先定义一下个性化教育是什么,不是什么。现在,手机上很多 App 的内容能够做到每个人看到的都是不一样的,这在某种程度上可以被称为个性化,但这不是我们想要的个性化教育。如果个性化仅仅是指千人千面,我完全可以把我们的内容随机推送给不同的人,实现每个人看到的内容不同。我认为,个性化教育要考虑的点,在于能不能发现每个个体之间在不同维度的共性,针对这些维度的共性,研究对应的教育方式。然后再去将每个维度综合起来,最终因为每个人在每个维度上的组合不一样,诞生出针对于每个人的个性化教育。这可能是个性化教育持续突破的方式。


雷鸣:AI 现在用了很多技术,包括视觉技术、自然语言、大数据分析等,从应用角度,哪些技术的发展会大幅度促进 AI 教育落地?


杨松帆:回答这个问题,我考虑的角度更多是,一项技术的突破对于教育的巨大影响和意义。我很看好这几个技术,第一个是显示技术,或者说人机交互技术。教育的本质还是学生是否有兴趣去学习,交互体验是里面重要的话题(大多数的游戏就具备好的交互体验)。如果能够大规模低成本的实现好的交互体验,这样的技术会对教育产生巨大的影响。第二,即使是在垂直细分领域(比如数学),自然且真实的人机对话还非常不成熟,人工智能被很多人描述成“人工智障”,也是因为它答非所问,不能理解人类,我非常期待这方面能够有所发展。


雷鸣:视频中演示的 AI 老师授课现实中已经有推广了吗?是实验性的推广还是针对性的?


杨松帆:我们从 2017 年 9 月开始做这个项目,研发过程非常长,目前已经进入初级落地阶段,效果非常好,已经有上千名学生在用这种方式上课。对于三四线城市来说,外教资源非常稀缺,通过这个项目为教育机构提供包括 AI 教师和课程内容在内的整体解决方案是很有价值的事情。


雷鸣:编程教育这块你怎么看?因为国家对标编程教育推动力度很大,今年新课标要求暑期之后落实计算机教育,你对此怎么看?另外,国外在远程教育上已经有一定的历史,这些经验对于中国来讲有多大的借鉴意义?


杨松帆:首先我非常看好编程教育,一方面,从当下社会发展的趋势来说,人类确实需要学会和机器相处,具体来说就是要学会编程的技术,理解机器的语言,这可能是国家把编程教育上升到这样一个高度的原因。另一方面,当 80 后和 90 后成为家长后,他们更关注孩子的素养和思维,比如逻辑和抽象思维等,这些都是编程的核心思维。所以,基于社会的发展和用户的需求,我判断这个赛道接下来还会变得更大,我非常看好这个方向。同时,好未来也在积极的学习和了解海内外优秀的编程教育,2019 年初好未来收购了一家叫 Code Monkey 的以色列编程公司,希望将好的编程教育输送给中国的万千家庭。

下期预告

4 月 24 日 周三晚 18:40,北京大学“人工智能前沿与产业趋势”第十讲,将由科大讯飞执行总裁刘聪为大家授课。


感兴趣的小伙伴可以添加 AI 前线编辑微信:caifangfang842852,备注“北大听课 + 公司名称 + 职位 or 学校 + 专业”,通过后可进入课程活动群,第一时间获取直播链接、视频回放、课程内容整理、北大 AI 公开课系列课程信息,以及与其他小伙伴互动交流。


祝大家听课愉快~

学习资料

在 AI 前线微信公众号(ID:ai-front)后台回复关键词“北大 AI 公开课”,可获取往期课程文字材料 + 视频回顾等学习资料。


课程回顾链接:


http://view.inews.qq.com/a/TEC2019041700490100



2019-04-21 14:158087

评论

发布
暂无评论
发现更多内容

ReactDOM.render在react源码中执行之后发生了什么?

flyzz177

React

跨集群流量调度实现 Kubernetes 集群金丝雀升级

Flomesh

K8s 多集群管理 流量管理

如果才能做好准备好前端面试

loveX001

JavaScript

美团前端一面必会react面试题

beifeng1996

React

用javascript分类刷leetcode17.栈(图文视频讲解)

js2030code

JavaScript LeetCode

【团队效率提升】Python-PyWebIO介绍

京东科技开发者

html 软件 markdown Python. 企业号 1 月 PK 榜

Hyperledger AnonCreds:开源、开放规范下,保护隐私的可验证凭证

BSN研习社

【12.30-1.6】写作社区优秀技术博文回顾

InfoQ写作社区官方

热门活动

fastposter v2.11.0 天花板级的海报生成器

物有本末

海报 海报生成器 海报编辑器 海报生成 海报小程序

React源码分析(三):useState,useReducer

flyzz177

React

前端leetcde算法面试套路之二叉树

js2030code

JavaScript LeetCode

谈谈前端性能优化-面试版

loveX001

JavaScript

React组件之间的通信方式总结(下)

beifeng1996

React

前端一面react面试题总结

beifeng1996

React

水印LOGO有哪些类型?如何在线给图片添加水印LOGO?

互联网民工阿强

图片处理 添加水印 水印 水印LOGO

React Context源码是怎么实现的呢

flyzz177

React

细说react源码中的合成事件

flyzz177

React

Java高手速成 | Spring、JPA与Hibernate的整合

TiAmo

hibernate Spring JPA Spring Java

这些js原型及原型链面试题你能做对几道

loveX001

JavaScript

前端经典面试题(有答案)

loveX001

JavaScript

SREWorks v1.4 版本发布 | 离线安装 & 前端重构

阿里云大数据AI技术

大数据 开源 运维 企业号 1 月 PK 榜

深航携手华为云,共建数字化智慧民航标杆

Geek_2d6073

FinClip 12 月大事件 | IDE支持小游戏开发调试和预览

FinClip

React源码分析1-jsx转换及React.createElement

flyzz177

React

HummerRisk V0.8.0:新增金山云、K8s基准检测、源IP审计分析等

HummerCloud

Kubernetes 云安全 云原生安全

React组件之间的通信方式总结(上)

beifeng1996

React

FLStudio水果萝卜最新汉化21版本下载

茶色酒

flstudio FLStudio21 FLStudio21.0.0

沙龙预告 | 1月11日举办数字化业务安全生产沙龙第2期

信通院IOMM数字化转型团队

数字化转型 IOMM 数字化业务安全生产

React源码分析(二)渲染机制

flyzz177

React

火山引擎DataLeap数据调度实例的 DAG 优化方案

字节跳动数据平台

大数据 数据治理 数据研发

前端leetcde算法面试套路之双指针

js2030code

JavaScript LeetCode

北大AI公开课2019 | 好未来杨松帆:为人工智能时代打造AI老师_AI&大模型_杨松帆_InfoQ精选文章