2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

“数据驱动生活,算法统治世界”——QCon 北京 2014 专题出品人吴甘沙专访

  • 2014-02-10
  • 本文字数:1930 字

    阅读完需:约 6 分钟

大数据可以被分为收集、组织、存储、检索、可视化以及数据分析,其核心是从数据中挖掘出价值。正如 Google 首席经济学家 Hal Varian 所说,数据是广泛可用的,所缺乏的是从中提取出知识的能力。数据收集的根本目的是根据需求从数据中提取有用的知识,并将其应用到具体的领域之中,而不同领域的大数据应用有不同的特点。

本届QCon 北京2014 ,InfoQ 特别邀请到英特尔中国研究院首席工程师吴甘沙来打造“数据驱动生活,算法统治世界”专题,解读数据与算法与普通人生活的关系。

吴甘沙主要研究方向包括大数据的计算范式和架构,软硬件协同设计,数据安全和权利,以及数据作为服务的应用模式和支撑环境。曾经参与和主持移动受控运行时(Managed Runtime)和并行编程等研究项目。发表学术论文10 余篇,获得美国专利23 项和国际专利10 余项,另有17 项专利待审中。

以下是采访内容。

InfoQ:吴甘沙你好,大家都知道你是 Intel 中国研究院的首席工程师,在大数据、Spark、嵌入式开发有许多研究,Intel 中国研究院培养了许多出色的工程师,在智能交通、传感器等方面做了许多工作。能否再请你介绍一下自己以及 Intel 中国研究院。

吴甘沙:我的经历很简单,离开大学后就一直在英特尔中国研究院。前五年做 Java 虚拟机,从服务器上一直做到手机上;中间四年做并行计算,从多核做到众核;最近四、五年转到分布式计算,先是物联网,现在专注于大数据。

英特尔中国研究院有不少有趣的、有影响力的研究,请大家关注英特尔的爱迪生,这项在 CES 上获得最佳创新大奖殊荣的技术就是来自中国研究院。另一个值得关注的技术是基于 X86 的云基站,它有可能在根本上改变未来的无线通信基础设施。

InfoQ:你曾经说过,无论做任何事,只要你认真对待,即使是走弯路,同样也能获得另一种成功。这让我想到了另外一句话:屡战屡败,屡败屡战,但每次失败都比上一次更美好。

吴甘沙:对我来说,学会欣赏失败的美好还需提高素养:)。从失败中成功,仍然是小概率事件,要放大这个概率需要两方面相辅相成:一是我们自身要有小强精神,学会失败并快乐着;二是环境要容忍和鼓励失败,英特尔研究院专门有一个奖项来奖励“有价值的失败”。

InfoQ:目前你关注的重点是什么?

吴甘沙:大数据如何产生价值。具体来说,兴趣从分布式基础设施、数据管理转到数据分析、可视化和用户工具;关注如何做到隐私无虞的数据开放,如何用数据安全技术和经济激励机制鼓励数据交换和共享。

InfoQ:过去一年中,你观察到大数据领域有哪些值得关注变化?

吴甘沙:国外更多地开始关注大数据栈的上层,关注行业应用和服务;国内在行业上走得更早,但发现技术没有跟上,现在也开始夯实大数据栈的下层,已经有专业的公司提供大数据基础产品和解决方案。Hadoop 还是主流,但 Spark 的早期接受者已经星火燎原。

在应用模式上,也慢慢从简单的查询和 NoSQL 取代 SQL,转为数据挖掘和非结构化数据分析。传统行业,如金融、健康医疗和教育,对大数据技术的需求井喷。但总体来讲,除商业外,做得很深、很透的大数据行业解决方案还不多,这是未来一两年值得期待的。另外,对数据隐私、安全、定价和交换 / 交易的关注显著升温。

InfoQ:你是 QCon 北京 2014 大会“数据驱动生活,算法统治世界”专题的出品人,能否谈谈你对此次专题的策划?

吴甘沙:我把主题定为“数据驱动生活,算法统治世界”。我们生活中很多的决策,如我们对什么产生了兴趣,发生了怎样的购买行为,都可能是数据驱动的。另一方面,从股市的运行到交通的控制,算法又在悄悄地指挥这个世界的运行。所以我们嘉宾的演讲题目必须是贴近我们生活的,同时嘉宾们又会用技术流的方式说明白这些应用下面大数据计算和分析的工作机制。

InfoQ:你怎么理解大数据处理与大数据应用?

吴甘沙:就是挖矿工具和挖矿的关系。挖矿工具要好用、耐用,而挖不同的矿则要靠经验加上工具的熟练使用。

InfoQ:Spark Summit 2013 上有许多非常棒的研究实践,包括 Spark、Spark Streaming 在内这样的高生产率工具出现后,帮助垂直领域专家发挥了创造力,这是否意味着未来几年大数据领域将迎来创新的高潮?出现通过大数据真正改变人们生活的公司和产品?

吴甘沙:我很相信这一点。Spark 以及 BDAS(Berkeley Data Analytics Stack)就是好用的挖矿工具,今年达到商用,明年全面铺开。那挖矿的人还等什么呢?这将是又一次淘金潮(Gold Rush)。

此专题详细信息,请见专题页面。关于此次 QCon 北京其他专题的详细信息,请移步至大会官网

需要特别注明的是,每年 QCon 大会门票都会在开幕前售罄,及早预定可提前确保席位,并享受更低折扣。现在报名参加将可享受 8 折优惠。团体购票(5 人及以上)将享有更多优惠。详请咨询 qcon【at】cn.infoq.com,或直接致电 010-64738142。报名请点击报名页面

2014-02-10 07:112608
用户头像

发布了 45 篇内容, 共 16.1 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

CAD提取图形外轮廓的方法

极客天地

淘宝天猫商品详情API数据解析(附代码)

tbapi

淘宝数据采集 淘宝API 淘宝商品详情API 天猫数据采集 天猫商品详情api

飞算 JavaAI 删除源码任务功能:清爽管理任务队列的实用指南

飞算JavaAI开发助手

Java AI 后端开发 idea intellij

应用案例丨拍张照片,就知道零件多少钱? 从7天到1小时:用视觉AI加速零件成本预测

Altair RapidMiner

人工智能 AI 数据分析 仿真 CAE

什么是 Active Directory 迁移?

运维有小邓

AD域 AD域管理 AD域迁移

塞讯科技入选 Gartner® AEV 领域代表厂商

塞讯科技

网络安全 信息安全 gartner中国

怎么用Mermaid代码生成流程图?流程图制作全攻略!

职场工具箱

人工智能 AI 流程图 在线白板 Mermaid

跟上节奏!KWDB 核心贡献挑战赛培训再度发车!

KaiwuDB

数据库 直播

基于YOLOv8的输电通道隐患检测系统:精准识别气球、风筝、鸟巢与垃圾【含完整训练源码+部署教程】

申公豹

人工智能

传统大数据 Hadoop 和 云原生湖仓 Databend 对比

Databend

揭秘Anubis:深度解析FIN7最新Python后门的隐匿技术

qife122

APT攻击 恶意软件分析

零公里二手车的坍塌

脑洞汽车

AI

PowerShell载荷添加出口暴力破解技术

qife122

PowerShell 端口扫描

从 “手动建目录” 到 “一键生成”:飞算 JavaAI 拯救企业级后台开发者

飞算JavaAI开发助手

Java 程序员 AI 一键生成

系统梳理 RAG 系统的 21 种分块策略

Baihai IDP

程序员 AI rag 检索增强生成 分块策略

CAD编辑文本的工具栏不显示该如何处理

极客天地

7 款替代 Zapier 的开源工作流工具推荐

NocoBase

GitHub 开源 AI 工作流 Zapier

技术的本质与边界:何时成功何时失败

qife122

人工智能 技术哲学

设备点检 设备维护经验总结(3)

万里无云万里天

工业 设备维护 工厂运维 设备点检

(一)数据模型架构原则:四层七阶,数据湖仓建模的“第一块基石”

白鲸开源

大数据 数据仓库 数据湖 技术分享

什么是ETL?一文讲清ETL全流程!

谷云科技RestCloud

数据处理 数据传输 数据同步 ETL 数据集成

Windows 7 TCP/IP劫持漏洞深度剖析

qife122

漏洞利用 TCP/IP劫持

从数据到价值:iPaaS如何赋能企业实时决策

谷云科技RestCloud

API 数据传输 集成平台 实时同步 ipaas

飞算JavaAI行间会话:企业级Java开发代码意图识别的“破局利刃”

飞算JavaAI开发助手

Java 后端开发 企业级开发 代码意图识别 行间会话

中烟创新BI数据大屏:赋能烟草营销智能决策与专卖精准监管

中烟创新

AI Compass前沿速览:PixVerse V5、gpt-realtime、Grok Code Fast、HunyuanVideo、OmniHuman-1.5、字节WaverAI视频、MiniCPM 4.5等

汀丶人工智能

微软安全更新指南新增“安全公告”标签,强化漏洞管理

qife122

微软安全 安全公告

图书馆AI推荐新书的开发流程

北京木奇移动技术有限公司

软件外包公司 AI技术应用 AI图书馆

“数据驱动生活,算法统治世界”——QCon北京2014专题出品人吴甘沙专访_QCon_包研_InfoQ精选文章