写点什么

数据科学的革命之区块链(第一部分)

  • 2018-05-17
  • 本文字数:1790 字

    阅读完需:约 6 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

预测分析 - 利用群体智慧的力量

现阶段的机器学习在一些复杂的社会现象的预测上是存在困难的,但是我们可以看到利用群体智慧这种方式在处理类似问题上的巨大发展潜力。群体智慧 指由个体组成的集体性的决策能力。在影响和预测人类行为等类似方向上,利用集体智慧已经展现出了良好的效果。一些相关学术论文中也提到个体决策本身是存在偏见的,但是如果把很多个体的决策放到一起,那么个体决策中偏见部分就会被消除,从而得到一个非常正确的预测结果。关于群体智慧模型方面也存在几种不同的方式,比如允许一个群体中的不同个体在进行决策时可以影响其他个体,或者被影响。这种群体智慧模型我们称之为 Crowds Within。

最近在 社会物理学 领域这种研究方式又重新出现。这个领域遵循一些简单的原则,并通过大规模的人类活动数据来发现并预测群体的一些行为模式。MIT 媒体实验室的 Alex Pentland 在他的区块链公司 Endor 中正在尝试将社会物理学与区块链技术相结合,创造出一个去中心化的协议来进行预测分析。用户可以在这个平台上通过一些简单的自然语言(比如提问 “ 谁会赢得总统大选 ”),然后得到由社会物理学基于大量的独立个体样本回答计算得出的最终答案。这个平台跟现存的预测市场比较类似,但是其最大的优点就是去中心化。因为这种模式不会像中心化的那些预测市场一样,可能受到人为操纵或者影响的风险,所以平台给出的结果可以保证不会被平台的拥有者篡改。此外,因为所有的预测都是公开透明的(每个人都可以看到),所以预测结果被第三方恶意篡改的风险也很小。

知识共享 - 创建知识共享经济

目前数据科学和机器学习存在一个问题是,很多团队或个人在进行模型研发和设计的时候是从零做起,很难从现有的、别人已经完善了的模型中汲取相关经验,或者直接采用。重复造轮子的过程数不胜数,经常会发现辛苦研究的内容是别人早已经做好并且完成了优化的。此外,人们还经常发现有了模型之后,却缺乏相关的数据进行训练和调优,完全不知道是否有其他在处理类似问题的团队已经有相关的数据。总结一下,其实就是缺乏一种在机器学习领域的知识共享途径和方式;我们当前缺乏一种简单有效的模型学习和分类的平台。

这也是 Synapse AI 这样的项目尝试去解决的问题。 Synapse AI 初衷是创建一个数据提供者、机器学习者,以及模型使用者这样的三方平台,在其之上可以很好地进行相关的知识、想法的分享,并慢慢形成一个稳定的循环经济生态。而通过代币来保证的这个系统的经济生态,可以让有需求的团队能从第三方团队那里获取所需的服务或数据,也是一种对服务提供方的经济奖励。通过这个平台,机器学习方也可以查询到更多的数据和更多的功能,类似于一种主动学习的方式。

众包打标 - 超越亚马逊的打标平台 Mechanical Turk

像亚马逊 Mechanical Turk 一样的打标平台,不论对数据提供者还是打标的人们来说,都处于一个比较低效的状态。这些中心化的平台是通过冗余的方式来保证打标效果的一致性和正确性。所以,一份相同的数据,会被多次进行甄别,并从中选择出主流标签作为最终的结果。对于数据的提供者来说,这是一种低效的办法,因为他们需要为冗余的甄别操作进行付费。而对于负责进行打标的人员来说,冗余的数据也为他们产生了不必要的工作负担。

Gems 这样的的采用代币作为货币的去中心化平台,其初衷就是为了解决上述的问题。Gems 主要面向三类用户:矿工(负责打标的人),质量管理员(负责验证打标效果的人),以及请求人(提供打标任务的人)。Gems 使用代币机制来保证他们这个平台内的健康稳定的经济体系。每个团队使用代币来完成交易,并且当他们的工作质量没有达到预期的时候,他们会被扣除所持有的代币作为一种惩罚方式。此外,Gems 还基于一套复杂的信任和荣誉机制来构建了平台的服务历史,并且平台之中每个人的历史操作对于他人来说都是可见的(因为可能有一些持有大量代币的团队可能会以损失部分代币为代价发起一些恶意攻击)。代币的方式对新用户也是非常有好的,因为代币并不需要你拥有一个银行账户。

查看英文原文 how blockchain will revolutionize data science


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2018-05-17 19:002180

评论

发布
暂无评论
发现更多内容

架构师训练营第 1 期第 5 周学习总结

好吃不贵

极客大学架构师训练营

太难了,5年Java开发经验,阿里面试了7轮终于拿下P7岗offer!

Java架构之路

Java 程序员 架构 面试 编程语言

javaCV学习-1-环境搭建及测试多张图片合成一个mp4的视频

诸葛小猿

Java 图片合成视频 机器视觉

架构师训练营第 1 期 week5 总结

张建亮

极客大学架构师训练营

工业互联网推动制造业数字化转型

CECBC

区块链 大数据

第一周作业1:设计图表

韩儿

一、食堂就餐卡系统UML设计

Geek_28b526

代码作业

Geek_4c1353

极客大学架构师训练营

架构师训练营第 5 周课后练习

叶纪想

极客大学架构师训练营

我在苦苦坚持的时候,WebStorm已经悄悄的“真香”起来

小Q

Java 学习 架构 面试 webstorm

架构师训练营第 1 期 week5

张建亮

极客大学架构师训练营

Consistent Hash

韩向民

科大讯飞胡国平:AI和5G互相辅助,认知中台传递基础技术能力

Xue Liang

学习 AI 语音识别

架构师训练营第五周课后练习

薛凯

第五周 技术选型(1)作业

蓝黑

极客大学架构师训练营

Week1-架构方法学习

evildracula

学习 架构

美滋滋!阿里内部最新出台Java开发规范和系统性能优化指南~

Java架构追梦

Java 学习 架构 面试 性能优化

玩一场用户故事的Cosplay

Bruce Talk

Agile 用户故事 Product Owner

区块链:现实与未来的二律背反

CECBC

区块链 虚拟世界

架构师训练营 -week05-总结

大刘

极客大学架构师训练营

架构师训练营第五周作业

吴传禹

极客大学架构师训练营

架构师训练营 1 期第 5 周:技术选型(一) - 作业

piercebn

极客大学架构师训练营

明星里程被盗?看区块链如何加强个人信息安全保护

CECBC

信息安全 数字签名

科大讯飞1024开发者节,有温度,有创新,有看点

Xue Liang

AI 技术方案 智能医疗 识别

架构师训练营培训第一周作业

lakers

极客大学架构师训练营

架构师训练营第五周总结

吴传禹

极客大学架构师训练营

架构师训练营 - 第一周课后练习

joshuamai

架构师训练营 -week05- 作业

大刘

极客大学架构师训练营

想要进大厂做架构师,需要掌握哪些技术?阿里内部绝密 “Java架构修炼宝典”从基础一直深入到源码!

Java架构之路

Java 程序员 架构 面试 编程语言

架构师训练营第五周总结

薛凯

golang实现一致性 hash 算法

Jacky.Chen

数据科学的革命之区块链(第一部分)_语言 & 开发_Devin Soni_InfoQ精选文章