InfoQ 编辑部出品——2021年度技术盘点与展望 了解详情
写点什么

“理解数据科学”系列文章

  • 2017 年 1 月 25 日
  • 本文字数:1082 字

    阅读完需:约 4 分钟

引言

数据科学快速成为各个开发人员和管理人员的关键技能,它看上去也十分有趣。但它也是相当复杂,因为存在很多的工程分析技术,你很难知道自己做得对不对或者哪里会有陷阱。在这一系列文章中,我们将探讨如何利用数据科学,即从已经采用并成功实施数据科学的人那里,了解数据科学的适用场景,以及如何让它成为你的资产。

内容

借助数据科学解决业务问题

企业愈发意识到,只要稍微运用一点数据科学就可以解决许多紧迫的问题。

此文是该系列文章中的第一篇。 Francine Bennett在文中着眼于那些成功的面向业务的数据科学项目。

案例研究:在大型金融组织中选择大数据和数据科学技术

将大数据和数据科学技术应用到企业组织里是变革性的项目,它有点类似向敏捷转型,同样充满了挑战。

在此文中, Christian Prokopp阐述了某个 FTSE100 金融服务公司的一个数据科学应用项目。

机器学习入门

Rafael Fernandes对机器学习领域做了简明扼要的介绍,并探讨了有监督学习和无监督机器学习方法。

从原始数据到数据科学:使非结构化数据结构化,以推动产品开发

随着Cassandra 和MongoDB 这样的非结构化数据库技术的出现,以及PostgreSQL 对JSON 的支持,非结构化数据已经变得相当易于存储和处理。很多情况下,软件工程师和数据工程师可以从数据建模中解脱出来,数据建模不再是采集数据并从数据中挖掘价值的先决条件。在此文中, Rishi Nalin Kumar介绍了数据的结构化及其它相关内容。

数据科学穿行于各个抽象层次

虽然Clojure 在工具和社区方面对深受欢迎的数据科学语言R 和Python 的支持并不好,但是它为发展统计思维和实践数据科学提供了良好的环境。作为一名主要使用Clojure 编程语言的数据科学家, Henry Garner常被问及为什么他不选用其它应用范围更广的编程语言。在此文中,他给出了自己选择 Clojure 的理由。

书评: Cathy O’Neil的《Weapons of Math Destruction》

Cathy O’Neil写道:“大数据有很多推崇者,但我不是。”O’Neil是一个博主 (mathsbabe.org),也是 DE Shaw 对冲基金的前量化策略分析师,她因为对冲基金模型大失所望,参加了占领华尔街运动。

该系列文章的策划人

Francine Bennett是 Mastodon C 的联合创始人兼 CEO。Mastodon C 专注敏捷大数据,为大型组织提供基于 Hadoop 和 Cassandra 的开源技术和分析技能,帮助他们挖掘数据的潜力。

Bennett是一名公认的分析应用程序和“数据科学”技术专家。她是英国皇家学会的特邀发言人,同时也为英国内阁办公室提供关于如何更好地使用数据的建议。她拥有数学和哲学学位,曾在谷歌担任分析主管。此外,她还是 DataKind UK 的理事。

查看英文原文: Getting a Handle on Data Science

2017 年 1 月 25 日 06:469106
用户头像

发布了 321 篇内容, 共 116.4 次阅读, 收获喜欢 121 次。

关注

评论

发布
暂无评论
发现更多内容

Dubbo面试题,mybatis架构图

Java 程序员 后端

Git,GitHub与GitLab的区别,java框架开发面试题

Java 程序员 后端

Google 面试六轮游,结果还是没过!Google面试真题分享

Java 程序员 后端

鸿蒙生态的2021:像犀牛在丛林飞

脑极体

docker-compose下的java应用启动顺序两部曲之二:实战

Java 程序员 后端

Github已星标180K又一神作,阿里巴巴内部并发编程笔记

Java 程序员 后端

CPU战争40年,终于把Intel打趴下了,字节跳动两轮面试让等hr

Java 程序员 后端

git(9)Git 内部原理,nginx模块工作原理

Java 程序员 后端

elasticsearch实战三部曲之二:文档操作,java基础填空题

Java 程序员 后端

git(8)Git 与其他系统,高性能mysql第四版pdf百度云

Java 程序员 后端

CDH+Kylin三部曲之二:部署和设置,java项目百度网盘

Java 程序员 后端

ECMAScript6(ES6)基础语法,linux基础及应用教程第二版

Java 程序员 后端

Elasticsearch聚合学习之五:排序结果不准的问题分析

Java 程序员 后端

Github神作!2021Java秋招高级面试指南,吃透至少阿里P6

Java 程序员 后端

HashMap(jdk1,linux学习路线图

Java 程序员 后端

CentOS部署Harbor镜像仓库,java进阶训练营百度网盘

Java 程序员 后端

Dijkstra求最短路算法 ( 超级超级详细的 ) 不断更新中

Java 程序员 后端

第 2 周作业

波波

「架构实战营」

Docker系列(3)--容器连接和Dockerfile,kafka的原理

Java 程序员 后端

爽!字节大佬DDD(领域驱动设计)巅峰之作,拆解业务代码真好用

编程 程序员 字节

Elasticsearch查询速度为什么这么快?看啥?问你呢

Java 程序员 后端

Flink1,java从入门到精通第四版pdf下载

Java 程序员 后端

flex 布局详解,我是如何收割多家大厂offer的

Java 程序员 后端

Docker 从入门到实践系列三 - Docker 常用命令

Java 程序员 后端

Elasticsearch聚合学习之二:区间聚合,java中高级面试题大全

Java 程序员 后端

Flink on Yarn三部曲之一:准备工作,java开发校招面试题

Java 程序员 后端

github搜索技巧小结,深入理解JVM

Java 程序员 后端

Hadoop分布式高可用HA集群搭建笔记(含Hive之构建)

Java 程序员 后端

HashMap底层实现原理及面试问题,linux服务器搭建教程视频

Java 程序员 后端

client-go实战之一:准备工作,干货分享

Java 程序员 后端

DL4J实战之五:矩阵操作基本功,微服务架构技术栈

Java 程序员 后端

“理解数据科学”系列文章-InfoQ