写点什么

创业公司难以采用 AI 的三个关键因素

  • 2021-06-28
  • 本文字数:1461 字

    阅读完需:约 5 分钟

创业公司难以采用AI的三个关键因素

本文最初发表于 Forbes 网站,经原作者 Gaurav Aggarwal 授权,InfoQ 中文站翻译并分享。


近十年来,出现了一些令人惊叹的技术。随着 2000 年代后期 iOS 和 Android 应用程序商店的推出,移动应用生态系统已经成熟。任何一个有好点子的人,都能开发出一个应用并进行发布。比如像 Uber、Snapchat、Instagram 这样的科技巨头都是这样诞生的。同时,我们也看到,云计算逐渐成为大家获取计算资源的主流,而人们也不需要再购买昂贵的服务器。


这十年,人工智能也成为人们关注的焦点。如果说,移动应用和云计算是对弱势者的颠覆性技术(它们提供了平等的竞争环境),那么人工智能就是对大公司更有利的技术,与大公司相比,创业公司可能不太适合采用这项技术。原因主要有以下三点。

1.数据挑战


人工智能是由数据驱动的,这意味着你拥有的数据越多,结果就越好。如果人工智能不能获得正确数量的数据,它的结果将会差强人意。


一般情况下,初创企业收集的数据量远不及大公司已经拥有的数据量,因为初创企业没有足够的客户基础和流量来产生大量的数据。比如,Facebook 就曾用来自 Instagram 公共账户中的 10 亿张图片来训练一个计算机视觉模型,而一般的初创企业则很难做到这一点。


虽然有一部分初创公司依靠诸如 ImageNet 这样的公共数据集来进行人工智能训练,但即便是经过世界顶尖大学教授们长达 9 年的数据收集工作,ImageNet 的图片数量仍仅为 1400 万张。


此外,初创公司还面临来自数据质量的挑战。人工智能所需的数据要被准备分类、标注,并且数据得是正确的。大公司有足够的资源和客户来收集大量的数据,然后再进行标注,从而保证数据的质量。

2.缺乏人工智能人才


虽然人工智能是最常被滥用的技术流行词,但它仍是一个日益增长的领域,并且人才短缺。


一位人工智能专家需要精通统计学和线性代数,理解如何建立模型,以及如何定义问题、问题的参数和结构。目前来看,拥有人工智能经验的人才是很有限的。并且对于初创公司来说,情况则更是雪上加霜,因为初创公司很难支付起巨额薪水。


而对大公司来说,则可以凭借雄厚的财力以及良好的发展前景雇佣到成熟的人工智能研究人员。目前,一些大型技术公司甚至在挖人工智能领域的教授,这也使得人工智能领域的研究生人才数量进一步下降。对人工智能专家来说,也更愿意与拥有资源的大公司合作。

3.计算成本


人工智能带来的成本问题是初创公司的另一个担忧。像深度学习这样的人工智能训练模型需要大量的时间和计算来训练。要建立一个“足够好”的模型,至少需要几个迭代的训练,以便对超参数进行调整和优化。因为模型需要多次训练,计算能力和开发时间都会付出很大代价。


仅仅对一个已有的模型 (比如 BERT)进行再训练,就会花费掉一个工程师的月薪。除计算成本外,初创公司还必须处理 MLOps 的基础设施。对大型企业而言,这没有什么挑战,因为它们拥有大量资金、专业的 IT 人员和管理计算和人工智能相关培训成本的资源。


与大公司相比,初创公司采用人工智能可能会面临以上三个方面的挑战。因为资源有限,客户群不大,所以对于初创公司来说,部署人工智能模型,并在此基础上作出业务决定是一件非常麻烦的事。人工智能是未来,但它需要用资源、专门的技术和时间来研究以及部署最新的人工智能模型。初创公司想采用人工智能技术的话,还需仔细考量。


作者介绍:

Gaurav Aggarwal,Sleek 和 Forbes U30 的联合创始人,工程师出身的企业家,帮助小企业通过人工智能生存和发展。


原文链接:

https://www.forbes.com/sites/forbestechcouncil/2021/04/23/three-key-factors-making-ai-adoption-hard-for-startups/?sh=4aefd1c3796e

2021-06-28 14:321710

评论

发布
暂无评论
发现更多内容

从建好到用好,阿里云原生微服务生态的演进

阿里巴巴云原生

提升客户服务体验的技巧

小炮

客户服务 SaaS平台

Apache ShardingSphere 5.1.0 执行引擎性能优化揭秘

SphereEx

数据库 ShardingSphere SphereEx apache 社区

恒源云(GpuShare)_租卡怎么选?看这一篇就够了!

恒源云

人工智能 GPU服务器

企业如何挖掘知识“金矿”?这本白皮书讲得够透彻!

百度大脑

Go 中的空白标识符(下划线)

宇宙之一粟

Go 语言 3月月更

Kubernetes中API的不同版本, Alpha, Beta, Stable 都是什么?

工程师薛昭君

Kubernetes API

手把手教你从Apk中取出算法

奋飞安全

android 安全 java

什么是数据恢复?数据丢失的最常见原因有哪些?

Ethereal

自动化知识图谱表示:从三元组到子图

第四范式开发者社区

人工智能 自动化 知识图谱

无监控不运维—浅述各种监控方案使用场景

穿过生命散发芬芳

3月月更

【愚公系列】2022年03月 Docker容器 Kafka集群的搭建

愚公搬代码

3月月更

AI+遥感智能解译,赋能智慧城市规划革新

百度大脑

治理有精度,AI赋智加强城市精细化管理

百度大脑

产品升级|1-2月合刊:多款重磅产品来袭

百度大脑

从0到1落地电商小程序之微服务设计

晨亮

「架构实战营」

Java AOT之GraalVM native image介绍以及简单长连接服务实践

BUG侦探

GraalVM java aot native image

弱监督语义分割:从图像级标注快进到像素级预测

网易云信

安全

网络安全入门5天速成教程: WEB安全渗透攻防技术

网络安全学海

网络安全 安全 信息安全 渗透测试 WEB安全

国家产业政策不断加码,氢能步入加速发展期

易观分析

氢能源 氢能源产业

TDesign React Starter 发布

TDesign

windows下C与C++执行cmd命令并实时获取输出

DS小龙哥

3月月更

延期通知 RocketMQ Summit 议题全揭秘

阿里巴巴云原生

浅谈信息熵在数字体验监控领域的应用

博睿数据

地狱开局的2022,穿好你的安全铠甲

脑极体

客户画像赋能百度推广生态实践

百度Geek说

前端 后端

错误码设计思考

木小风

Java 架构 错误码

详细的网站定制步骤有哪些?

源字节1号

网站开发 软件定制

Nginx限速模块初探

喀拉峻

nginx

Python 的排序方法 sort 和 sorted 的区别

AlwaysBeta

Python

你的“数学潜意识”原来可以被唤醒!

博文视点Broadview

创业公司难以采用AI的三个关键因素_AI&大模型_Gaurav Aggarwal_InfoQ精选文章