百度技术沙龙第67期回顾:开源专场

在不久前的2016百度世界大会上,百度首席科学家吴恩达首次宣布对外开放百度深度学习平台,以推动人工智能技术的快速普及,把在搜索、图像识别、语音识别、自然语言处理、用户画像及情感分析等人工智能领域的优势整合升级,为程序开发者提供了一个功能更全、效果更好的深度学习框架。其实,百度一直非常重视对于开源软件的使用,同时也愿意把内部的技术以开源的形式贡献出来,和开源社区的同学们进行广泛的合作。从2010年开始,百度的各项技术就已经陆续在Github上开源出来,例如多次被评为Github社区中国十大开源项目的echarts等。

本期百度开源技术专场技术沙龙,将介绍百度开源的最新两个项目,包括paddlepaddle百度深度学习框架(类比是Google的Tensorflow ),和百度搜索架构开源产品线(tera,bfs,galaxy等),并结合具体的产品案例,分享百度开源技术最新实践经验。这些项目都已经在github/baidu下开源,希望让更多同学们了解并参与到这些开源项目中。

本期讲师介绍

  • 主题一:Paddle技术开源介绍

    于洋:百度工程师,从事百度深度学习平台PaddlePaddle开发工作。硕士毕业于天津大学,15年毕业后加入百度深度学习实验室。随后一直从事深度学习系统的研发,主要负责深度学习系统的性能优化和功能开发工作。

    主题摘要:近年来深度学习成为了计算机领域中的热点问题,百度开源了核心的机器学习训练平台PaddlePaddle。本期演讲包括PaddlePaddle深度学习平台的介绍,简单的深度学习知识,PaddlePaddle的实现特点和机制,以及以手写识别和情感分类任务为例,如何使用PaddlePaddle解决实际的问题。

  • 主题二:百度搜索开源基础架构系统解密

    颜世光:网页搜索部基础架构团队,早期从事Spider系统架构相关研发,期间主持了百度第三代Spider系统的设计与实现。当前主要研究方向为大规模分布式系统,是百度海量数据库Tera、百度文件系统BFS和集群操作系统Galaxy的主要作者。热衷开源,先后推动了百度多个重量级系统对外开源。

    主题摘要:搜索引擎背后是一套超大规模的数据处理系统,这套系统构建在一系列基础设施之上,包括网络通讯框架、分布式文件系统、集群管理系统、结构化数据库和分布式锁等等。随着近年来公司大力拥抱开源,这套基础设施也逐渐开放出来。本次演讲主要介绍这套开源基础架构的设计思想和应用情况。

内容回顾

    • 高深:百度技术沙龙超级棒。@InfoQ

    • Warning: 都是干货。@InfoQ

    • 徳晨:讲师很棒,思路清晰,学习了@InfoQ

    • #命中you¥:#百度技术沙龙#希望多多举行这样的分享会,支持支持,前路漫漫,我们还有很长的路要走,希望百度引领我在技术的道路上越走越远。@InfoQ


现场图片展示

  • 认真的讲师
  • 现场互动
  • 聚精会神的参会者
  • 圆桌论坛