写点什么

系列免费线上公开课:大数据和人工智能如何助力信息安全?

  • 2017-10-29
  • 本文字数:3581 字

    阅读完需:约 12 分钟

中国信息安全市场中,瀚思科技是一家跨界于大数据和信息安全的公司。

瀚思科技技术介绍

瀚思科技通过安全智能分析和内部威胁防护切入下一代的安全市场,让安全智能可见、可知、可控。他们相信未来是安全是智能的,通过大数据的分析来提供用户安全智能的能力是未来的核心能力。瀚思通过大数据平台、机器学习与人工智能,结合具体业务和安全场景,来自主判断是否有恶意行为行为发生。

瀚思团队成员 2014 年便开始用机器学习做病毒分类引擎,是最早将人工智能和信息安全结合的团队之一。是中国第一家大数据安全企业,也是网络安全全球 500 强。

大数据和人工智能如何助力信息安全?

整个企业安全市场从第一款杀毒软件到现在时间并不长,大概从 1987 年开始,我们有了第一款杀毒软件。两年之后有了第一个蠕虫。到 1992 年我们才有第一款商业防火墙。基本上这个时期的信息安全是一个被动的应对姿态,有新的安全威胁基本上要过一段时间后才会推出相应的产品。一直到 2010 年之前,安全防御技术相对来讲都是很固定的。2010 年被称为是 APT 元年,防御理念变为分析,而不是单纯检测、非实时、用户参与。

安全领域很早就开始使用大数据分析,比如说 2004 年左右做垃圾邮件处理数据量为一天上百万封。但受技术限制只能处理比较单一的数据,比如做垃圾邮件处理和病毒样本处理分别需要两个系统,基本上不会用通用的方案。

随着 Hadoop 的方案比较成熟,一直到最近更好的 Spark 的方案成熟之后,才有了比较强的各种数据多样性数据的方案。包括用 Spark 做 BI 类型的分析,用算法做多样性数据的整合,从里面抽出比较重要的威胁情报。在企业内部部署的数据可以做攻击链分析,这些都是由于大数据可以让我们做更复杂的多样性数据分析的典型例子。

真正对企业安全会造成比较大的改变的,是人工智能。从 2010 年左右开始,我们开始使用卷积神经网络,可以用深度学习做病毒样本的分类。这个方案红到什么程度呢?基本上所有的硅谷创业公司只要是安全的都会说他用人工智能。另外一些领域里面,比如行为分析里面,可以用无监督学习算法或者一些统计类的算法,比如大家听得多的用户行为分析或者反欺诈,里面都会用统计类的算法。

所有这些新的一些技术能导致更快的开发出更复杂的一些产品,有个明显趋势就是很多的产品被综合了。这个时候就冒出了新安全产品,如威胁情报和大数据安全分析。

瀚思科技大数据安全分析产品框架

瀚思科技具有四条产品线。第一个是大数据安全分析平台 HanSight Enterprise,是最核心的产品,基于大数据、机器学习和行为识别技术,真正实现针对安全大数据的有效存储与实时分析。其余三块都是以这个分析平台为核心扩展出来。包括 HanSight UBA(瀚思用户行为分析系统)、HanSight NTA(瀚思网络流量分析系统) 和 HanSight TI(瀚思安全威胁情报)。

实际上这几个产品线与安全分析平台,都是互相关联、互为加强和补充的。威胁情报可以帮助把网络行为、用户行为关联串起来,安全分析中心把所有的日志汇总,反过来又为用户行为分析提供数据。

线上技术分享预告

了解了瀚思技术之后,我们正式宣布:11 月,AI 前线联合瀚思科技,将给大家带来四场技术干货分享!每周一次,周四晚八点半,在 AI 前线社群中进行。

话题 1:企业如何整合复杂技术打造分析平台

分享主题:随着企业安全边界的扩大化模糊化、各类威胁新出速度越来越快、影响越来越广,视企业安全边界为静态、仍然依赖各种特征码技术的传统安全思路早已落后,无法实际解决安全问题。必须通过各种创新,整合大数据、人工智能、可视化等领域的最新技术进展,安全产品才能解决目前和将来的企业安全难题。

但如何选择并整合各种技术是复杂系统工程,比常规企业安全软件开发需要考虑更多因素。本次分享中对大数据、人工智能、可视化的最新进展和应用案例做个总结,重点讨论大数据平台云部署运维、交互批处理与实时流处理的关系、有监督学习解决的安全问题和大数据可视化这四个细分领域。

演讲人:万晓川先生现任瀚思科技首席科学家,负责瀚思核心技术架构与安全前沿研究。万先生是核心安全算法、APT 沙箱、异常检测(Anomaly Detection)和用户行为分析(User Behavior Analysis)的世界级专家,拥有 10 项安全行业美国专利并长期积极倡导将机器学习应用于信息安全。

作为瀚思科技首席科学家,万晓川主要负责瀚思核心技术架构与安全前沿研究,并倡导和研究将机器学习应用于信息安全。

在加盟瀚思之前,万先生于 2004 加入全球最知名的安全公司 - 趋势科技(Trendmicro),持续专注基于机器学习的前瞻性安全产品研发工作,包括病毒样本自动分类、基于指令翻译的超小型沙箱、网络流扫描设备,同时还设计了趋势科技的整个病毒分析后台架构。

2006 年万晓川先生在全球范围内首度将机器学习应用于病毒自动分析系统,在 0.1% 误报率时可以侦测 71% 的未知病毒,这项技术保证了趋势科技的杀毒能力持续排名世界前三。2007 年万先生再次成功将机器学习应用在垃圾邮件识别,并取得 96% 以上的全球第一识别率,战胜了思科花 8.3 亿美元收购的 IronPort。

自 2010 年起,万晓川先生以高级架构师和项目总监身份主导设计并开发了网页安全模拟分析引擎和 APT 防御产品线的沙箱,并在 2014 年全球权威的 NSS lab 评测中击败了主要竞争对手 FireEye,获得 APT 检测率世界第一。万晓川先生曾是趋势科技中国研发中心技术级别最高的核心技术人员,也曾是趋势科技专利委员会中国区主席。

万晓川先生毕业于东南大学少年班。

欢迎安全、大数据、AI 领域的小伙伴加盟瀚思科技参与前沿技术研发(自荐邮箱 hr@hansight.com)

话题 2 :基于 AWS 构建高可用性的大数据安全分析平台

分享主题:面向企业的 SaaS 服务是一个高速增长的领域,近年来各种初创公司和融资事件层出不穷。各类公有云平台也让创业公司更加容易的推出自家的 SaaS 服务。这里我们将要介绍如何在 AWS 上快速构建起基于 SaaS 的大数据安全解决方案,如何基于 AWS 的基础设施构建高可用性以及高可扩展性的系统。最终,通过公有云,通过 SaaS 的方式,交付安全价值给客户。

演讲人:汪磊,瀚思科技研发总监,12 年企业级安全产品开发经验,擅长大数据技术架构以及大规模 SaaS 服务架构,拥有两项美国专利,目前带领团队负责瀚思产品研发工作,曾任趋势科技资深项目经理、途牛旅游网研发总监职务,曾带领团队在 AWS 平台构建 SaaS 安全网关,直接与美国 Zscaler 竞争。

毕业于华中科技大学,获得软件理论硕士学位

话题 3: 基于深度学习的二进制恶意样本检测

分享主题:全球正在经历一场由科技驱动的数字化转型,传统技术已经不能适应病毒数量飞速增长的发展态势。而基于沙箱的检测方案无法满足 APT 攻击的检测需求,也受到多种反沙箱技术的干扰。在充分考察过各种技术方案的优劣后,瀚思科技开发出了基于深度学习的二进制病毒样本检测技术,可以做到沙箱同等水平的 99% 的检测准确率,而误报率低于 1/1000。基于深度学习的病毒检测技术无需沙箱环境,直接将样本文件转换为二维图片,进而应用改造后的卷积神经网络 Inception V4 进行训练和检测。极大的简化了病毒检测流程,速度更是远超沙箱技术,可以做到日均百万样本的检测量。由于深度学习是自动抽取数千万样本的海量特征,使得我们的深度学习模型具有极强的通用性,即使数月不更新,也能做到大于 90% 的检测率。

主讲人:吴睿 ,瀚思科技高级算法专家,用户行为分析专家毕业于 University of Missouri –Columbia 计算机系

精通领域:异常检测算法,内部威胁检测,深度学习

话题 4 基于 Flink 流处理的动态实时超大规模用户行为分析

分享主题:传统的用户行为分析系统通常以离线批处理模式根据既定规则对用户数据进行分析。规则相对简单,且更新规则需要重启系统。而在安全领域,许多安全场景要求能够 7/24 小时实时监测威胁,作出报警。因此我们需要一个高吞吐量的实时计算框架来满足对实时性的需求。在这里我们将介绍网络安全中基于流式计算框架 Flink 并搭载机器学习算法的超大规模用户行为分析系统(UBA)的实践经验。看瀚思科技如何利用 Flink 的高效流式处理框架,承载 UBA 核心计算任务,并融合批处理和流处理模式,如何定义完备易用的场景规则语法,并利用 Flink 对复杂事件处理(CEP)的原生支持,实现规则的动态更新的实战经验。

主讲人 :吴昊,瀚思科技高级软件架构师,毕业于 University of Waterloo 计算机系

精通领域:大数据处理,大型流式处理系统架构设计

关于 AI 前线社群公开课

AI 前线社群公开课 是 InfoQ2016 年发起的品牌活动。

旨在利用 InfoQ 人工智能行业自身影响力,集合产业界优秀技术工作者、一线专家,为技术从业者传道授业解惑,打造最专业的线上技术分享与互动社群。

授课模式为:图文直播 45 分钟 + 答疑互动 15 分钟,每周一次。

想听听技术干货?想在线上与大师面对面?加入我们的社群吧!

加群方式

对线上分享感兴趣?想具体了解并申请讲师?回复“讲师“查看 ppt 说明。

2017-10-29 19:001912
用户头像
Tina InfoQ高级编辑

发布了 1693 篇内容, 共 1368.0 次阅读, 收获喜欢 4027 次。

关注

评论

发布
暂无评论
发现更多内容

面试突击53:常见的 HTTP 状态码有哪些?

王磊

Java 面试

大数据培训如何使用DPM规划用户画像

@零度

大数据 dpm

CPU利用率从10%提升至60%:中型企业云原生成本优化实战指南

星汉未来

运维 云原生 IT成本 星汉未来 FinOps

java培训 | 零基础学习java开发的学习方法有哪些

@零度

Java 学习方法

6 月直播 7 场干货全剧透!今天:飞腾CPU调优原理及方法 | 第 19 期

OpenAnolis小助手

cpu 直播 sig 龙蜥大讲堂 飞腾

为企业业务流程提速的BPM

力软低代码开发平台

成本节省 50%,10 人团队使用函数计算开发 wolai 在线文档应用

Serverless Devs

Serverless wolai

2022 支付宝五福 |“联机版”打年兽背后的网络技术 RTMS

阿里巴巴终端技术

客户端 网络技术 网络通信

优酷老片修复算法,超高清重温童年回忆

阿里巴巴文娱技术

算法 计算机视觉 视频 多媒体

ironSource LevelPlay 聚合平台,现已适配应用开发框架工具包 Flutter

极客天地

墨天轮访谈 | SelectDB 衣国垒:Apache Doris(incubating)1.0版本特性解析与未来规划

墨天轮

数据库 Apaache Doris 国产数据库

幸运哈希算法竞猜游戏开发特点分析(成熟方案)

开发微hkkf5566

RxJS系列01:响应式编程与异步

代码与野兽

6月月更

相约龙蜥,开源一“夏”!2022编程之夏ASoC开始报名了

OpenAnolis小助手

阿里巴巴 开源项目 龙蜥社区 高校学生 技术项目

运维领域告警智能定级原理探索(含详细实验报告)

云智慧AIOps社区

运维 安全 监控 告警

如何撰写数据中台蓝图方案

agileai

数据中台 企业服务总线 主数据平台 数据分析平台 蓝图方案

web前端培训带你学习 Midwayjs 实战

@零度

node.js 前端开发

为什么你的网站不被收录了呢?

源字节1号

做数据时代的加油站,ShardingSphere 为易车数据库架构演进提供新动力

SphereEx

Apache 数据库 开源 ShardingSphere SphereEx

深度操作系统20.6正式发布!

深度操作系统

开源 深度操作系统 deepin20.6 新版本 深度

Jetpack Composes 入门

坚果

6月月更

【直播回顾】参与ArkUI,共建OpenHarmony繁荣生态

OpenHarmony开发者

Open Harmony

【LeetCode】火柴拼正方形Java题解

Albert

LeetCode 6月月更

2022年4月线上终端药品增长迅猛,市场政策合规进程加快

易观分析

医药类

为什么你的网站需要搭建在线帮助中心?

小炮

定档615 | 数字化基础软件自主创新分享周即将来袭,点击获取“通关密钥”!

网易数帆

大数据 云原生 基础软件 数字化转型 自主创新

蛟分承影,雁落忘归——袋鼠云一站式全自动化运维管家ChengYing(承影)正式开源

袋鼠云数栈

《数字经济全景白皮书》证券期货用户数字化篇 重磅发布

易观分析

证券 期货

WASM VS EVM,波卡的选择预示了公链未来

One Block Community

区块链 公链 波卡生态

Docker下RabbitMQ延时队列实战两部曲之一:极速体验

程序员欣宸

RabbitMQ 5月月更 RabbtiMQ延时队列

招聘 | 上班轰趴,下班狼人杀,天天招人,怕是要发!

Alluxio

面试 程序员人生 招聘 互联网热点 Alluxio

系列免费线上公开课:大数据和人工智能如何助力信息安全?_大数据_Tina_InfoQ精选文章