【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

2016 年,文本分析、情感分析和社交分析的 10 大趋势

  • 2016-02-03
  • 本文字数:2732 字

    阅读完需:约 9 分钟

文本分析、情感分析和社交分析帮助你在一定规模上转化成客户、病人、公众以及市场的“声音”。这项技术目前大量地应用于一系列的工业产品中,从医疗健康到金融、媒体、甚至客户市场。它们从线上、社交网络、企业数据源中提取商业洞察力。

它从文本中、音频中、图像中还有网络连接中提取洞察力,它可真是个有用的东西!

目前分析技术发展得还是相当不错的,尽管在某些领域,例如数字分析和市场研究有些稍稍落后。但是甚至是在例如“客户体验、社群聆听、用户交互”方面,还是有很多发展空间。这个快速发展的市场空间无论对于新加入的玩家还是深耕已久的资深人士都意味着大量的机遇。

随着技术和应用不断融合,与其独立地检验每个分析领域,还不如好好地观察整体的效果。忽视情感的社交分析是不完整的,并且为了从网络上获取社交情感数据并调查情感数据,我们真的需要文本分析技术。

本文对即将到来的 2016 年,针对文本分析、情感分析和社交分析的发展趋势进行一个前瞻性的观察。

一、多语言才是王道

尽管单纯英文的文本分析一直保持常态,但仅将一种语言做好,也比囊括很多种语言,却哪种都做得潦草要强得多。机器学习和机器翻译已经向着多语种文本分析迈进了一大步,使其成为一个全新的标准。但是如果你的确需要做多语种的开发尝试,事先也要做一些调查:很多开发者在其核心语言上很强,但在别的语言上就很弱了。所以说选择的时候还是小心一点。

二、文本分析获得认可

文本分析能力对于客户体验、市场研究、客户洞察、数字分析乃至媒体评测来说都是关键解决方案,各个文本分析服务提供商在分析能力的优势上不断竞争。总的趋势是“量化定性”,文本分析被纳入业务解决方案中是十分重要的事。

三、机器学习、统计学和语言工程并存

明天是属于机器学习、递归神经网络以及相似技术的,但是今天,长期建立的语言工程方法仍占上风。这里我指的是分类系统、分析器、词法和句法网络以及句法规则系统。目前我们处在一个“百花齐放、百家争鸣”的时代,所以很多种方法都是可以并存的。举例来说,甚至众包数据处理的领军企业:CrowdFlower 都全面拥抱机器学习了,初创企业 Idibon 都把传统和现代相结合作为一大卖点:“你可以组建自定义的分类系统,并使用机器学习、规则和你已有的字典 / 模式去调整它们。”

四、图像分析进入主流

全球领先的图像分析提供商已将图像分析技术应用于社交媒体的品牌信号解读中—不信你看看 Pulsar 和 Crimson Hexagon—并且通过机器学习,图像分析技术已成为 IBM 在 2015 年收购 Alchemy API 的一大卖点。的确,火热的初创企业 MetaMind 在 2015 年从 NLP 领域转型到图像分析,缘于其意识到图像分析背后的巨大机遇。

五、语音分析取得突破,视频分析随之而来

整个市场喜欢谈论多渠道分析和用户旅程,这涉及到多重触点。并且社交网络和网络媒体中充斥着视频,说出来的话,还有非文本形式的语言要素,包括语调、语速、音量和重复,都传递着含义,而这些含义都可以通过语音分析和语音转文字来获取。不仅仅是客服中心,2016 年,所有的市场研究人员、出版人员、研究和洞察专业人士都在不断寻找突破。可以期待,未来语音分析也将成为推动人机会话接口发展的重要力量。

六、扩展式情感分析

广告人员早就认识到情感可以改变消费者的决定,但直到近日,广泛地、系统地对于情感与决策的研究已经超越了我们的能力范围。根据你的角度,进入情感分析,或者是情感分析的子类,或者是其姊妹类。带着量化我们的情绪反应的目的,使用面部表情分析从图像和视频中(或从语音或文本中)提取我们的情感状态。这方面的服务提供商有:视频服务的 Affectiva、Emotient 和 Realeyes,语音服务的 Beyond Verbal 以及文本服务的 Kanjoya;相关的受众包括广告商、媒体、市场研究人员和代理商。

七、ISO 网络表情分析

我们已经有了文本、图像、语音、视频等,那为什么我们还要用网络表情呢?因为它们简洁、易用、生动、有趣,它们补充并且对长格式的内容形成冲击,这就是为什么互联网俚语灭亡了。Facebook 正在尝试对网络表情进行挖掘,更好的是,我们还看到了像 Line stickers 这样的变种。现在我们需要的就是网络表情分析了。这个领域的技术正在通过像 Emogi 这样的初创企业不断兴起。尽管大多数人也不过就是用计数和分类来获取网络表情语义,像 Instagram 工程师 Thomas Dimson 和斯洛文尼亚研究组织 CLARIN.SI 都是这么干的。但他们当中的一些公司,比如 SwiftKey,还是值得关注的。

八、网络 + 内容的深度洞察

这一点既是我对于 2016 年的趋势预测,同时我在 2015 年对市场研究公司 TNS 的数据科学家 Preriit Souda 访谈时也提到过。Preriit 指出:“网络为会话赋予结构,内容挖掘为其赋予含义。”洞察力源自于对于信息与连接的理解,也来自于连接是如何被激活的。因此为你的工具包加一个图形数据库和网络可视化工具吧,这就是为什么 Neo4j.js 和 Gephi 这么成功的原因。建立一个类似于 QlikView 的数据分析平台也是一个选择,一个可以协同文本和数字分析的选择,对于 2016 年来说这是一定要做的事。

九、2016 年,你会读到(或与之交互)多得多的机器编写的内容

机器编写内容的技术叫自然语言合成(Natural Language Generation,NLG),它提供根据算法从文本、数据、规则和内容中撰写文章、信件、短信息、摘要和翻译的能力。NLG 就是为大容量、高重复量的内容而生的:金融、体育和天气预报。相关的服务提供商有 Arria、Narrative Science、Automated Insights、Data2Content 和 Yseop。你也可以看看你与你心爱的虚拟助手进行对话时的机器端:Siri、Google Now、Cortana 或是 Amazon Alexa,或是自动客服、其它程序化相应系统。后面的这些系统都归类于自然语言交互(Natural Language Interaction,NLI);其中 Artificial Solutions 还是值得一看的。

十、机器翻译逐渐成熟

长久以来,人们一直希望拥有一个“星际迷航”那样的通用翻译器,但自从 1950 年科学家称机器翻译可以在 3~5 年内实现,精准的、可信赖的机器翻译就一直是个谜。(ACM Queue 撰文《Natural Language Translation at the Intersection of AI and HCI》充分地讨论了人机结合条件下机器翻译的状态)我不能说胜利就在眼前,但是多亏了大数据和机器学习,2016 年(或 2017 年)对于大多数任务来说,主流语言的机器翻译能做到足够好。这就是胜利!

总结

如果你是一个文本分析、情感分析或是社交分析学家,解决方案提供商或是用户,每一个趋势都会影响到你,无论是直接地还是间接地。因为人类的数据现在已经被编织成为我们每天赖以生存的技术网。连接这张网的线就是更多的数据,更有效地使用,来创造改变生活的机器智能。

原文转载自 Seth Grimes 的博客《10 text, sentiment, and social analytics trends for 2016》,原文作者已授权转载。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2016-02-03 19:496715

评论

发布
暂无评论
发现更多内容

告别内卷,瓴羊飞渡,中国ToB生态迎来 iPhone 时刻

B Impact

给我五分钟!让你掌握React的Redux中间件原理

汽车之家客户端前端团队

大模型基础:理论与技术演进

永佳

Cnetos7系统安装git仓库教程

百度搜索:蓝易云

git Linux centos7 运维 云服务器

Docker学习路线6:使用第三方镜像

小万哥

Docker 容器 运维 后端 开发

以 AI 变革组织运营与管理,2023 Kyligence 用户大会盛大举行

Kyligence

数据分析 数智化

Amazon 上的数字孪生:使用 L3 预测性数字孪生来预测“行为”

亚马逊云科技 (Amazon Web Services)

Amazon

Docker学习路线5:在 Docker 中实现数据持久化

小万哥

Java c++ Go Docker 后端

H5页面秒开优化与实践

汽车之家客户端前端团队

小巧玲珑的AVIF,你的网页图片换新装!

汽车之家客户端前端团队

快速离线安装MySql数据库

zhengzai7

MySQL

Centos7系列安装FineBI教程。

百度搜索:蓝易云

云计算 Linux centos 运维 FineBI

24款绘画软件app推荐免费!手绘爱好者必备。

彭宏豪95

效率工具 软件推荐 科技 画图工具 绘图软件

从十万行代码定位undefined is not an object (evaluating 't.length')

汽车之家客户端前端团队

Nautilus Chain 更换全新测试网,主网即将在不久上线

鳄鱼视界

突破:GGX(Golden Gate)发布悉尼测试网,跨链基础设施迈出重要一步

股市老人

Linux系统iptables与Firewalld防火墙区别?

百度搜索:蓝易云

云计算 Linux 运维 Firewalld iptables

Nautilus Chain 更换全新测试网,主网即将在不久上线

威廉META

不容错过!10个Python自动化办公库免费送!(上)

程序员晚枫

Python 自动化办公

牛刀专业低代码开发实战—奖酬金预分配

牛刀专业低代码

低代码 牛刀低代码 低代码paas平台 java低代码 私有化低代码

“开放合作 共享未来”华秋联手伙伴共创硬件生态,助力物联网硬件加速创新

华秋电子

深入了解C++优先队列

攻城狮Wayne

Nautilus Chain 更换全新测试网,主网即将在不久上线

EOSdreamer111

代码随想录Day16 - 二叉树(三)

jjn0703

vue项目nginx服务器部署

百度搜索:蓝易云

vue.js Linux 运维 Web 云服务器

学科知识图谱学习平台项目 :技术栈Java、Neo4j、MySQL等超详细教学

汀丶人工智能

人工智能 自然语言处理 深度学习 neo4j 知识图谱

2023-07-14:讲一讲Kafka与RocketMQ中存储设计的异同?

福大大架构师每日一题

福大大架构师每日一题

给大模型穹顶,树一根存力支柱

脑极体

存储

Nautilus Chain 更换全新测试网,主网即将在不久上线

股市老人

CentOS7系统搭建SFTP教程。

百度搜索:蓝易云

Linux 运维 SSH 云服务器 sftp

Linux系统安装redis教程。

百度搜索:蓝易云

redis 云计算 Linux 运维 云服务器

2016年,文本分析、情感分析和社交分析的10大趋势_大数据_Seth Grimes_InfoQ精选文章