写点什么

大数据挖掘

收录了 大数据挖掘 频道下的 50 篇内容

大数据挖掘更多时间都在于清洗数据

编者按:本文作者汪榕曾写过一篇文章:《以什么姿势进入数据挖掘会少走弯路》,是对想入行大数据的读者的肺腑之言,其中也表达了作者的一些想法,希望大家不要随便去上没有结合业务的收费培训班课程;而后,他有了结合他本人的工作经验,写一系列帮助大家进行实践学习课程文章的想法,InfoQ也觉得这是件非常有意义的事情,特别是对于大数据行业1-3年工作经验的人士,或者是没有相关工作经验但是想入行大数据行业的人。课程的名称是“数据挖掘与数据产品的那些事”,目的是:1. 引导目标人群正确学习大数据挖掘与数据产品;2. 协助代码能力薄弱的学习者逐渐掌握大数据核心编码技巧;3. 帮助目标人群理解大数据挖掘生态圈的数据流程体系;4. 分享大数据领域实践数据产品与数据挖掘开发案例;5.交流大数据挖掘从业者职业规划和发展方向。这系列文章会在InfoQ上形成一个专栏,本文是专栏的第三篇。

大数据杂谈微课堂 | 数据挖掘技术和房地产的有效结合

数据挖掘依托房地产行业累积的海量数据,从中挖掘出最有价值的数据, 从而改善行业体验,推动行业进步。 本文内容主要包括如下两个部分: 1)数据挖掘在房产领域的可行性和必要性 2)数据挖掘在链家网的实践详情

简单之极,搭建属于自己的 Data Mining 环境(Spark 版本)

本文作者汪榕曾写过一篇文章:《以什么姿势进入数据挖掘会少走弯路》,是对想入行大数据的读者的肺腑之言,其中也表达了作者的一些想法,希望大家不要随便去上没有结合业务的收费培训班课程;而后,他有了结合他本人的工作经验,写一系列帮助大家进行实践学习课程文章的想法,InfoQ也觉得这是件非常有意义的事情,特别是对于大数据行业1-3年工作经验的人士,或者是没有相关工作经验但是想入行大数据行业的人。课程的名称是“数据挖掘与数据产品的那些事”。这系列文章会在InfoQ上形成一个专栏,本文是专栏的第一篇。

学会用 Spark 实现朴素贝叶斯算法

本文作者汪榕曾写过一篇文章:《以什么姿势进入数据挖掘会少走弯路》,是对想入行大数据的读者的肺腑之言,其中也表达了作者的一些想法,希望大家不要随便去上没有结合业务的收费培训班课程;而后,他有了结合他本人的工作经验,写一系列帮助大家进行实践学习课程文章的想法,InfoQ也觉得这是件非常有意义的事情,特别是对于大数据行业1-3年工作经验的人士,或者是没有相关工作经验但是想入行大数据行业的人。课程的名称是“数据挖掘与数据产品的那些事”。这系列文章会在InfoQ上形成一个专栏,本文是专栏的第二篇。

王欣:多维深耕打造数字化银行
王欣:多维深耕打造数字化银行

本文由西安银行副行长兼首席信息官王欣撰文,分享其数字化重构银行经营发展模式的理念。

机器学习——海量数据挖掘解决方案

数据时代里,互联网用户每天都会直接或间接使用到大数据技术的成果,直接面向用户的比如搜索引擎的排序结果,间接影响用户的比如网络游戏的流失用户预测、支付平台的欺诈交易监测等等。达观数据技术团队开发过智能文本内容审核系统、作弊监测系统、用户建模系统等多个基于大数据技术的应用系统。机器学习是大数据挖掘的一大基础,本文以机器学习为切入点,将达观在大数据技术实践时的一些经验与大家分享。

专访微信人工智能实验室: 社交网络已成为人工智能的一个热点

腾讯旗下微信团队和香港科技大学于11月30日宣布成立联合实验室,WeChat-HKUST Joint Lab on Artificial Intelligence Technology,简称:WHAT Lab。该实验室将以人工智能为主要研究方向,旨在改善用户的生活服务体验,借助大数据拓展机器学习的边界。InfoQ对成立WHAT Lab的事件,同时采访了香港科技大学的杨强教授和微信技术架构部模式识别中心总监陈波。

专访链家蔡白银:大数据如何解决房产领域痛点推动行业进步

每个人都需要住房,房地产行业历史悠久,数据积累下来是非常可观的。链家成立了15年,这15年里积累了百万级别的成交数据,用户画像数量超过2000万,日志数据6T。链家依托房地产行业累积的海量数据,从中挖掘出最有价值的数据,进行房屋估价、房源推荐等等,从而改善行业体验,推动行业进步。

即时物流领域的AI技术:物理世界的数字化和智能化
即时物流领域的 AI 技术:物理世界的数字化和智能化

在 AICon 北京 2019 大会上,何仁清讲师做了《即时物流领域的AI技术:物理世界的数字化和智能化》主题演讲。

刻画现实世界的AI技术和应用
刻画现实世界的 AI 技术和应用

美团外卖日单量超过3000W,拥有近百万骑手数量,是全球最大的即时配送网络...

国际跨界交流,百分点AI认知技术如何实现智慧警务?
国际跨界交流,百分点 AI 认知技术如何实现智慧警务?

本文来自《百分点认知智能实验室》系列。

Uber ATG数据挖掘:大规模识别真实道路场景用于自动驾驶
Uber ATG 数据挖掘:大规模识别真实道路场景用于自动驾驶

行人是怎样过马路的?有时候并不像“到对面去”那么简单,Uber为了实现更加可靠的自动驾驶对此数据进行了挖掘研究。

美团骑手智能助手的技术与实践
美团骑手智能助手的技术与实践

本次分享介绍美团骑手智能助手的技术与实践。

短视频行业强势崛起 品牌如何占领营销制高地?
短视频行业强势崛起 品牌如何占领营销制高地?

随着中国手机网民规模的持续上升,手游、直播、短视频等行业迎来了高速发展期,同时也将各大品牌主引向了全新的营销战场。

一个案例告诉你如何使用 Kyligence + Spark 进行大数据机器学习
一个案例告诉你如何使用 Kyligence + Spark 进行大数据机器学习

以基于Spark的分布式机器学习平台 Databricks为例,讲解以 Kyligence 为数据源到分布式数据分析平台的高效无缝的解决方案。

2012.4.25 微博热报:测试用例、硅谷热点

今天的微博热报主要关注了有关测试用例执行的讨论和硅谷近期的热点发展趋势。

达观数据个性化推荐系统实践

本文从数据处理、用户行为建模到个性化推荐,分享达观数据在个性化推荐系统方面积累的一些经验。

短视频行业爆发成长 数据呈现品牌营销新思路
短视频行业爆发成长 数据呈现品牌营销新思路

随着互联网技术和人工智能算法的逐渐成熟,以抖音、快手、西瓜视频等为代表的短视频行业得到了爆发式发展,用手机端观看网络视频已成为现代人的流行娱乐方式,“两微一抖”更是成为企业品牌主传播新标配。

网易杭研的中台往事
网易杭研的中台往事

这篇介绍网易杭研在中台道路上十多年的探索和经验教训,并补充在中台组织管理方面的方法。

数据仓库与大数据挖掘技术调度平台- TASKCTL
数据仓库与大数据挖掘技术调度平台 - TASKCTL

TASKCTL是专门为批量作业调度自动化打造的一款专业的敏捷调度工具,批量调度自动化技术是大数据时代数据整合后台不可缺少的重要技术。现在数据是整个社会和各企业团体的重要资产,管好数据、用好数据是整个社会的重要命题。

数据仓库
国产开源
TASKCTL
大数据仓库
DevOps工具
大数据挖掘专题_资料-InfoQ中文网