收录了 模型评估 频道下的 50 篇内容
如何使用TF-Hub库对预训练模型进行微调?
今天,我们非常高兴地推出 Amazon SageMaker Processing,这是Amazon SageMaker 的一项新功能
随着对大语言模型(LLM)评估领域的深入研究,我们更加清楚地认识到全面理解评估过程中的问题对于有效评估LLM至关重要。 本文探讨了机器学习模型评估中出现的常见问题,并深入研究了LLM对模型评估领域带来的重大挑战。在评估方法方面,我们将其划分为直接评
在经历了两年的混战后,大模型终于从技术走向应用,“不卷参数、卷落地”已经成了行业共识。但大模型落地并非易事,要想清楚场景价值,也要选对实现路径。
本文主要分享在智能风控体系下模型如何做到全流程自动化的迭代。
支撑Uber每天1400 万次出行背后的技术架构
本文为华为云系列文章之一。
本文主要介绍NLP模型开发平台的架构和实现细节,以及舆情业务中的应用,希望能为大家提供一些参考。
人工智能正在改变这个世界,作为一个前端工程师,我们也能参与其中,为前端技术领域换上前端智能化引擎。本文整理自阿里巴巴淘宝技术部高级前端专家甄焱鲲(甄子)在 QCon全球软件开发大会(北京站)2019 上的演讲,他用前端工程师熟悉的语言定义,阐释了“什么是前端智能化”,从实际应用场景出发,设计应用案例,分享了相关技术体系在实践中进行工程化落地经验。
在通用能力、专用场景能力应用成熟度三个能力域上均获优异结果。
随着全球范围内信用卡欺诈损失不断增加,银行及电子商务企业在欺诈交易完成之前检测出它们的能力也愈加重要。
在数字化转型浪潮席卷全球的今天,AI技术已经成为行业公认的升级重点,正在越来越多的领域为业务带来创新价值。
根据我们之前在Precision处的分析,其实可以看得出来,当样本均衡过后,假正率会更高,因为有更多紫色点被判断错误,而样本均衡之前,假正率比
导语:本文是模型评估指标系列的第一篇,将详细地介绍分类模型中基于混淆矩阵衍生出来的各个指标的计算公式,如准确率,精确率,召回率,FPR,TPR,ROC曲线的绘制逻辑,AUC的计算公. 本文首发在个人知乎和微信公众号:一直学习一直爽
在大模型如火如荼的背后,幻觉(hallucination)倾向就越发的明显,它正在越发的生产着 “完全没有出处的非真实内容”。这样对于商业化而言是一个巨大的挑战,来面对一个不可控、不可预测和不可靠的大模型……
大模型对搜推技术产生了深远的影响,极大地推动了搜推技术的演进趋势,使得搜推更加的智能化和个性化,然而在搜推中引入大模型时同样面临一系列的挑战,例如商品知识的幻觉,复杂查询的理解,个性化商品推荐,隐私和安全等问题。
突破搜索与推荐边界,京东大模型重塑电商效率与体验
6 月 14 日,第六届“北京智源大会”在中关村展示中心开幕。
本文介绍了如何充分利用软件工程的架构模式、设计模式和原则来实现一个高可用、可靠并且高效的机器学习系统。
在本文中,作者Maarit Widmann和Alfredo Roccato讨论了如何使用基于Delta-p统计量的解决方案来预测信贷资格。