限时领|《AI 百问百答》专栏课+实体书(包邮)! 了解详情
写点什么

2016 年,文本分析、情感分析和社交分析的 10 大趋势

  • 2016-02-03
  • 本文字数:2732 字

    阅读完需:约 9 分钟

文本分析、情感分析和社交分析帮助你在一定规模上转化成客户、病人、公众以及市场的“声音”。这项技术目前大量地应用于一系列的工业产品中,从医疗健康到金融、媒体、甚至客户市场。它们从线上、社交网络、企业数据源中提取商业洞察力。

它从文本中、音频中、图像中还有网络连接中提取洞察力,它可真是个有用的东西!

目前分析技术发展得还是相当不错的,尽管在某些领域,例如数字分析和市场研究有些稍稍落后。但是甚至是在例如“客户体验、社群聆听、用户交互”方面,还是有很多发展空间。这个快速发展的市场空间无论对于新加入的玩家还是深耕已久的资深人士都意味着大量的机遇。

随着技术和应用不断融合,与其独立地检验每个分析领域,还不如好好地观察整体的效果。忽视情感的社交分析是不完整的,并且为了从网络上获取社交情感数据并调查情感数据,我们真的需要文本分析技术。

本文对即将到来的 2016 年,针对文本分析、情感分析和社交分析的发展趋势进行一个前瞻性的观察。

一、多语言才是王道

尽管单纯英文的文本分析一直保持常态,但仅将一种语言做好,也比囊括很多种语言,却哪种都做得潦草要强得多。机器学习和机器翻译已经向着多语种文本分析迈进了一大步,使其成为一个全新的标准。但是如果你的确需要做多语种的开发尝试,事先也要做一些调查:很多开发者在其核心语言上很强,但在别的语言上就很弱了。所以说选择的时候还是小心一点。

二、文本分析获得认可

文本分析能力对于客户体验、市场研究、客户洞察、数字分析乃至媒体评测来说都是关键解决方案,各个文本分析服务提供商在分析能力的优势上不断竞争。总的趋势是“量化定性”,文本分析被纳入业务解决方案中是十分重要的事。

三、机器学习、统计学和语言工程并存

明天是属于机器学习、递归神经网络以及相似技术的,但是今天,长期建立的语言工程方法仍占上风。这里我指的是分类系统、分析器、词法和句法网络以及句法规则系统。目前我们处在一个“百花齐放、百家争鸣”的时代,所以很多种方法都是可以并存的。举例来说,甚至众包数据处理的领军企业:CrowdFlower 都全面拥抱机器学习了,初创企业 Idibon 都把传统和现代相结合作为一大卖点:“你可以组建自定义的分类系统,并使用机器学习、规则和你已有的字典 / 模式去调整它们。”

四、图像分析进入主流

全球领先的图像分析提供商已将图像分析技术应用于社交媒体的品牌信号解读中—不信你看看 Pulsar 和 Crimson Hexagon—并且通过机器学习,图像分析技术已成为 IBM 在 2015 年收购 Alchemy API 的一大卖点。的确,火热的初创企业 MetaMind 在 2015 年从 NLP 领域转型到图像分析,缘于其意识到图像分析背后的巨大机遇。

五、语音分析取得突破,视频分析随之而来

整个市场喜欢谈论多渠道分析和用户旅程,这涉及到多重触点。并且社交网络和网络媒体中充斥着视频,说出来的话,还有非文本形式的语言要素,包括语调、语速、音量和重复,都传递着含义,而这些含义都可以通过语音分析和语音转文字来获取。不仅仅是客服中心,2016 年,所有的市场研究人员、出版人员、研究和洞察专业人士都在不断寻找突破。可以期待,未来语音分析也将成为推动人机会话接口发展的重要力量。

六、扩展式情感分析

广告人员早就认识到情感可以改变消费者的决定,但直到近日,广泛地、系统地对于情感与决策的研究已经超越了我们的能力范围。根据你的角度,进入情感分析,或者是情感分析的子类,或者是其姊妹类。带着量化我们的情绪反应的目的,使用面部表情分析从图像和视频中(或从语音或文本中)提取我们的情感状态。这方面的服务提供商有:视频服务的 Affectiva、Emotient 和 Realeyes,语音服务的 Beyond Verbal 以及文本服务的 Kanjoya;相关的受众包括广告商、媒体、市场研究人员和代理商。

七、ISO 网络表情分析

我们已经有了文本、图像、语音、视频等,那为什么我们还要用网络表情呢?因为它们简洁、易用、生动、有趣,它们补充并且对长格式的内容形成冲击,这就是为什么互联网俚语灭亡了。Facebook 正在尝试对网络表情进行挖掘,更好的是,我们还看到了像 Line stickers 这样的变种。现在我们需要的就是网络表情分析了。这个领域的技术正在通过像 Emogi 这样的初创企业不断兴起。尽管大多数人也不过就是用计数和分类来获取网络表情语义,像 Instagram 工程师 Thomas Dimson 和斯洛文尼亚研究组织 CLARIN.SI 都是这么干的。但他们当中的一些公司,比如 SwiftKey,还是值得关注的。

八、网络 + 内容的深度洞察

这一点既是我对于 2016 年的趋势预测,同时我在 2015 年对市场研究公司 TNS 的数据科学家 Preriit Souda 访谈时也提到过。Preriit 指出:“网络为会话赋予结构,内容挖掘为其赋予含义。”洞察力源自于对于信息与连接的理解,也来自于连接是如何被激活的。因此为你的工具包加一个图形数据库和网络可视化工具吧,这就是为什么 Neo4j.js 和 Gephi 这么成功的原因。建立一个类似于 QlikView 的数据分析平台也是一个选择,一个可以协同文本和数字分析的选择,对于 2016 年来说这是一定要做的事。

九、2016 年,你会读到(或与之交互)多得多的机器编写的内容

机器编写内容的技术叫自然语言合成(Natural Language Generation,NLG),它提供根据算法从文本、数据、规则和内容中撰写文章、信件、短信息、摘要和翻译的能力。NLG 就是为大容量、高重复量的内容而生的:金融、体育和天气预报。相关的服务提供商有 Arria、Narrative Science、Automated Insights、Data2Content 和 Yseop。你也可以看看你与你心爱的虚拟助手进行对话时的机器端:Siri、Google Now、Cortana 或是 Amazon Alexa,或是自动客服、其它程序化相应系统。后面的这些系统都归类于自然语言交互(Natural Language Interaction,NLI);其中 Artificial Solutions 还是值得一看的。

十、机器翻译逐渐成熟

长久以来,人们一直希望拥有一个“星际迷航”那样的通用翻译器,但自从 1950 年科学家称机器翻译可以在 3~5 年内实现,精准的、可信赖的机器翻译就一直是个谜。(ACM Queue 撰文《Natural Language Translation at the Intersection of AI and HCI》充分地讨论了人机结合条件下机器翻译的状态)我不能说胜利就在眼前,但是多亏了大数据和机器学习,2016 年(或 2017 年)对于大多数任务来说,主流语言的机器翻译能做到足够好。这就是胜利!

总结

如果你是一个文本分析、情感分析或是社交分析学家,解决方案提供商或是用户,每一个趋势都会影响到你,无论是直接地还是间接地。因为人类的数据现在已经被编织成为我们每天赖以生存的技术网。连接这张网的线就是更多的数据,更有效地使用,来创造改变生活的机器智能。

原文转载自 Seth Grimes 的博客《10 text, sentiment, and social analytics trends for 2016》,原文作者已授权转载。

2016-02-03 19:497222

评论

发布
暂无评论
发现更多内容

优化了MYSQL大量写入问题,老板奖励了1000块给我

华为云开发者联盟

MySQL sql 写入

2020年不容错过的10本大咖之作 | 你最Pick哪一本?

博文视点Broadview

基于GaussDB(DWS)的全文检索特性,了解一下?

华为云开发者联盟

数据库 数据仓库 数据

Flink SQL 实战:HBase 的结合应用

Apache Flink

flink

Spring Cloud Gateway (六) 自定义 Global Filter

Java 网关 SpringcloudGateway

「每日一题」抖音面试题:请阐述vue数据绑定的实现原理

Java架构师迁哥

免费下载来自阿里巴巴 双11 的《云原生大规模应用落地指南》

阿里巴巴云原生

阿里巴巴 阿里云 开发者 云原生 k8s

敏捷与安全不可兼得吗?看完这篇文章后,我想说:未必!

华为云开发者联盟

敏捷 安全 开发

主从哨兵集群终于给你说明白了

moon聊技术

数据库 redis

阿里拆中台?从架构师角度解读中台

javaba韩老师

架构 中台战略 TOGAF 中台的前世今生 中台的由来

深层互联带领自动旅游讲解耳麦进入“非入耳”时代

DT极客

干了三年的Java,你竟然还不会MySQL性能优化

华为云开发者联盟

Java MySQL sql

如何通过 Serverless 轻松识别验证码?

阿里巴巴云原生

人工智能 阿里云 Serverless 云原生 数据采集

字节内部MySQL宝典意外流出!极致经典,堪称数据库的天花板

比伯

Java 编程 架构 面试 技术宅

移动设备管理平台的搭建(基于STF/ATXServer2)

行者AI

人工智能

干货|原来IPFS是这样存储文件的

QTech

区块链技术 IPFS 星际文件系统

40亿条/秒!Flink流批一体在阿里双11首次落地的背后

Apache Flink

flink 流计算

基于 Flink+Iceberg 构建企业级实时数据湖

Apache Flink

大数据 flink 流计算

LeetCode题解:264. 丑数 II,三指针,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

2021 第一份唠嗑

大头虾

数字化浪潮下 哪些银行业务或“生变”

CECBC

金融科技

light-rtc: 理念与实践

阿里云CloudImagine

架构 音视频 WebRTC RTC

“区块链+有机蔬菜”农产品溯源项目落地

CECBC

农业发展 农业

软件测试--前后端数据交互

测试人生路

软件测试

架构师训练营第六周作业

zamkai

内存分页不就够了?为什么还要分段?还有段页式?

yes

操作系统 内存管理

如何利用状态同步开发一款游戏

Isa 婷婷

node.js 游戏开发 24小时自助游戏厅 联机游戏

打造新一代企业数据驱动体系

StarRocks

数据库 大数据 数据分析 数字化转型 OLAP

Flink 双流 Join 的3种操作示例

Apache Flink

flink 流计算

面试软件测试所需要掌握的7个技能

华为云开发者联盟

sql 面试 测试

引起故障的原因

jorden wang

2016年,文本分析、情感分析和社交分析的10大趋势_大数据_Seth Grimes_InfoQ精选文章