收录了 python语音识别 频道下的 50 篇内容
Kaldi之父Daniel Povey认为,当前语音识别系统的高精准度仅针对特定语音类型。
小米在积极拥抱开源的路上又进了一步。
也许在将来,脑机接口会直接将你所想的内容转换成代码,或者说是软件本身。
Nuance公司是世界上最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。近日,Nuance推出了一个专门针对移动和消费电子产品的开发平台—Nuance Mix。Nuance Mix已经推出的测试版本中,可以帮助设备制造商和开发人员快速、轻松地创建自定义语音和自然语言处理接口,从而加速下一代互联网的发展,包括智能家居、游戏、机器人,以及消费者健康和健身等行业。
你可以通过这些有趣但也具有挑战性的项目来增强 Python 编程技能。
编程语言和框架旨在实现特定的项目目标,这是你选择的主要标准,不要只看受欢迎程度。
允许开发者快速构建、训练和微调会话式人工智能模型。
据Google Assistant产品经理Chris Ramsdaled在博客中所写,使用Google Assistant SDK,可将Google Assistant的语音功能集成到运行Raspberry Pi 3和Linux的用户设备中。但是目前尚不清楚该SDK的商业使用许可情况。
本次分享介绍通过人工智能和人工标注更有效的“互动”,半监督学习可以加速数据标注的流程。
亚马逊在最近的一篇博文中宣布了Rekognition Service新增的三项新特性。这些新特性可用于识别图像中的文本、最多可从一张图片中识别出一百张人脸,以及基于上千万张人脸进行实时脸部识别。
本次PaddleSpeech发布的中英文语音识别预训练模型Conformer_talcs可以通过PaddleSpeech封装的命令行工具CLI或者Python接口快速使用,开发者们可以基于此搭建自己的智能语音应用,也可以参考示例训练自己的中英文语音识别模型。
200美元“造”出一台可由语音控制外加能进行人脸识别的自主飞行无人机;结合 MATLAB 进行物联网数据分析;使用 Node-RED 和 Twilio 在 Bluemix 上开发服务器监视器;美国发表物联网安全策略准则 物联网安全亟待解决;IBM和SAP合力打造美国的物联网时代;全国首家NB-IoT(窄带物联网)规模化商用福州开通。
我们使用简单的测试用例来对各种高级编程语言进行了比较。
作为 Google Cloud 的合作伙伴,三星使用 Cloud TPU —— Google Cloud 的内置机器学习处理器,更快地训练其 ASR 模型,并最终提升 Bixby 的准确性。
马克·扎克伯格在2016年12月19日发布了一篇博文,分享自己为家里构建AI管理系统、实现家居自动化控制的思路和过程。
毫无疑问,机器学习是目前数据分析领域最为炙手可热的主题之一,其研究成果早已渗透到了日常生活中,从垃圾邮件过滤到人脸支付,从信用欺诈检测到自然灾害预测等场景无一不活跃着机器学习的身影。但即便机器学习已经得到了广泛的应用,开发人员能够从网上找到很多机器学习算法实现,但是这些代码往往“脏”而“乱”,没有经过大规模的生产验证。幸运的是现在这种窘境已经不复存在了,因为Google、Microsoft和IBM分别发布并开源了自己的机器学习工具包TensorFlow、DMTK和SystemML,每一个项目都是各自公司知识积累的结晶,在其内部发挥着举足轻重的作用,那么这些工具包相互之间又有哪些区别呢?
在交通运输行业,民用航空无疑是“高大上”的典型代表。万亿美元,是工业领域的重要支柱之一,也是传统行业中的明星与骄傲。
Amazon、Microsoft、Databricks、Google、HPE和IBM机器学习技术,广度、深度,易用性详解。
一旦掌握这些技能,我敢说,你将会成为一个更“性感”的数据科学家。
本文翻译自 Thuy T. Pham 发布的 52 Useful Machine Learning & Prediction APIs,经原作者授权由InfoQ中文站翻译并分享。 本文介绍了超过 50 个机器学习、预测、文本分析与分类、人脸识别、文本翻译等等领域的开放 API ,这些 API 来源于 IBM、Google 以及 Microsoft 这些在人工智能领域迅猛发展的公司,希望能够帮助开发者让他们的应用更加的智能。