“理解数据科学”系列文章

阅读数:3523 2017 年 1 月 25 日

话题:JavaPython函数式编程架构Apache大数据语言 & 开发AI

引言

数据科学快速成为各个开发人员和管理人员的关键技能,它看上去也十分有趣。但它也是相当复杂,因为存在很多的工程分析技术,你很难知道自己做得对不对或者哪里会有陷阱。在这一系列文章中,我们将探讨如何利用数据科学,即从已经采用并成功实施数据科学的人那里,了解数据科学的适用场景,以及如何让它成为你的资产。

内容

借助数据科学解决业务问题

企业愈发意识到,只要稍微运用一点数据科学就可以解决许多紧迫的问题。

此文是该系列文章中的第一篇。Francine Bennett在文中着眼于那些成功的面向业务的数据科学项目。

案例研究:在大型金融组织中选择大数据和数据科学技术

将大数据和数据科学技术应用到企业组织里是变革性的项目,它有点类似向敏捷转型,同样充满了挑战。

在此文中,Christian Prokopp阐述了某个 FTSE100 金融服务公司的一个数据科学应用项目。

机器学习入门

Rafael Fernandes对机器学习领域做了简明扼要的介绍,并探讨了有监督学习和无监督机器学习方法。

从原始数据到数据科学:使非结构化数据结构化,以推动产品开发

随着 Cassandra 和 MongoDB 这样的非结构化数据库技术的出现,以及 PostgreSQL 对 JSON 的支持,非结构化数据已经变得相当易于存储和处理。很多情况下,软件工程师和数据工程师可以从数据建模中解脱出来,数据建模不再是采集数据并从数据中挖掘价值的先决条件。在此文中,Rishi Nalin Kumar介绍了数据的结构化及其它相关内容。

数据科学穿行于各个抽象层次

虽然 Clojure 在工具和社区方面对深受欢迎的数据科学语言 R 和 Python 的支持并不好,但是它为发展统计思维和实践数据科学提供了良好的环境。作为一名主要使用 Clojure 编程语言的数据科学家,Henry Garner常被问及为什么他不选用其它应用范围更广的编程语言。在此文中,他给出了自己选择 Clojure 的理由。

书评:Cathy O'Neil的《Weapons of Math Destruction》

Cathy O'Neil写道:“大数据有很多推崇者,但我不是。”O'Neil是一个博主 (mathsbabe.org),也是 DE Shaw 对冲基金的前量化策略分析师,她因为对冲基金模型大失所望,参加了占领华尔街运动。

该系列文章的策划人

Francine Bennett是 Mastodon C 的联合创始人兼 CEO。Mastodon C 专注敏捷大数据,为大型组织提供基于 Hadoop 和 Cassandra 的开源技术和分析技能,帮助他们挖掘数据的潜力。

Bennett是一名公认的分析应用程序和“数据科学”技术专家。她是英国皇家学会的特邀发言人,同时也为英国内阁办公室提供关于如何更好地使用数据的建议。她拥有数学和哲学学位,曾在谷歌担任分析主管。此外,她还是 DataKind UK 的理事。

查看英文原文:Getting a Handle on Data Science