写点什么

模型评估

收录了 模型评估 频道下的 50 篇内容

TensorFlow工程实战(一):用TF-Hub库微调模型评估人物年龄
TensorFlow 工程实战(一):用 TF-Hub 库微调模型评估人物年龄

如何使用TF-Hub库对预训练模型进行微调?

Amazon SageMaker Processing – 完全托管的数据处理和模型评估
Amazon SageMaker Processing – 完全托管的数据处理和模型评估

今天,我们非常高兴地推出 Amazon SageMaker Processing,这是Amazon SageMaker 的一项新功能

大语言模型评估全解:评估流程、评估方法及常见问题
大语言模型评估全解:评估流程、评估方法及常见问题

随着对大语言模型(LLM)评估领域的深入研究,我们更加清楚地认识到全面理解评估过程中的问题对于有效评估LLM至关重要。 本文探讨了机器学习模型评估中出现的常见问题,并深入研究了LLM对模型评估领域带来的重大挑战。在评估方法方面,我们将其划分为直接评

人工智能
白海科技
LLMOps
大模型评估
企业号 7 月 PK 榜
大模型落地高风险区,如何一步步避开陷阱?|对话 AI 原生《云智实验室》
大模型落地高风险区,如何一步步避开陷阱?|对话 AI 原生《云智实验室》

在经历了两年的混战后,大模型终于从技术走向应用,“不卷参数、卷落地”已经成了行业共识。但大模型落地并非易事,要想清楚场景价值,也要选对实现路径。

智能风控模型的自动化迭代
智能风控模型的自动化迭代

本文主要分享在智能风控体系下模型如何做到全流程自动化的迭代。

Uber自动驾驶技术解读:Uber ATG机器学习架构与版本控制平台
Uber 自动驾驶技术解读:Uber ATG 机器学习架构与版本控制平台

支撑Uber每天1400 万次出行背后的技术架构

机器学习笔记(二):线性回归
机器学习笔记(二):线性回归

本文为华为云系列文章之一。

NLP模型开发平台在舆情分析中的设计和实践(下)
NLP 模型开发平台在舆情分析中的设计和实践(下)

本文主要介绍NLP模型开发平台的架构和实现细节,以及舆情业务中的应用,希望能为大家提供一些参考。

设计生成代码的前端智能研发实践
设计生成代码的前端智能研发实践

人工智能正在改变这个世界,作为一个前端工程师,我们也能参与其中,为前端技术领域换上前端智能化引擎。本文整理自阿里巴巴淘宝技术部高级前端专家甄焱鲲(甄子)在 QCon全球软件开发大会(北京站)2019 上的演讲,他用前端工程师熟悉的语言定义,阐释了“什么是前端智能化”,从实际应用场景出发,设计应用案例,分享了相关技术体系在实践中进行工程化落地经验。

首批!华为云盘古研发大模型通过代码大模型评估,获当前最高等级
首批!华为云盘古研发大模型通过代码大模型评估,获当前最高等级

在通用能力、专用场景能力应用成熟度三个能力域上均获优异结果。

人工智能
华为云
华为云开发者联盟
华为云盘古大模型
企业号2024年6月PK榜
使用随机森林、神经自编码和隔离森林技术检测欺诈内容
使用随机森林、神经自编码和隔离森林技术检测欺诈内容

随着全球范围内信用卡欺诈损失不断增加,银行及电子商务企业在欺诈交易完成之前检测出它们的能力也愈加重要。

全栈全场景AI助力智能升级,一文看懂企业AI开发路线
全栈全场景 AI 助力智能升级,一文看懂企业 AI 开发路线

在数字化转型浪潮席卷全球的今天,AI技术已经成为行业公认的升级重点,正在越来越多的领域为业务带来创新价值。

支持向量机 -SVC 的模型评估指标

根据我们之前在Precision处的分析,其实可以看得出来,当样本均衡过后,假正率会更高,因为有更多紫色点被判断错误,而样本均衡之前,假正率比

Python
机器学习
算法
sklearn
11月月更
模型评估指标-1-基础篇-FPR/TPR/F1/ROC/AUC
模型评估指标 -1- 基础篇 -FPR/TPR/F1/ROC/AUC

导语:本文是模型评估指标系列的第一篇,将详细地介绍分类模型中基于混淆矩阵衍生出来的各个指标的计算公式,如准确率,精确率,召回率,FPR,TPR,ROC曲线的绘制逻辑,AUC的计算公. 本文首发在个人知乎和微信公众号:一直学习一直爽

机器学习
模型评估
分类模型
一直学习一直爽
“驯服”可控大模型,白海发布一站式大模型微调平台IDP LM
“驯服”可控大模型,白海发布一站式大模型微调平台 IDP LM

在大模型如火如荼的背后,幻觉(hallucination)倾向就越发的明显,它正在越发的生产着 “完全没有出处的非真实内容”。这样对于商业化而言是一个巨大的挑战,来面对一个不可控、不可预测和不可靠的大模型……

京东大模型革命电商搜推技术:挑战、实践与未来趋势
京东大模型革命电商搜推技术:挑战、实践与未来趋势

大模型对搜推技术产生了深远的影响,极大地推动了搜推技术的演进趋势,使得搜推更加的智能化和个性化,然而在搜推中引入大模型时同样面临一系列的挑战,例如商品知识的幻觉,复杂查询的理解,个性化商品推荐,隐私和安全等问题。

京东大模型革命电商搜推技术:挑战、实践与未来趋势
京东大模型革命电商搜推技术:挑战、实践与未来趋势

突破搜索与推荐边界,京东大模型重塑电商效率与体验

智源推出大模型全家桶及全栈开源技术基座新版图
智源推出大模型全家桶及全栈开源技术基座新版图

6 月 14 日,第六届“北京智源大会”在中关村展示中心开幕。

构建可扩展的机器学习系统(二):构建机器学习管道
构建可扩展的机器学习系统(二):构建机器学习管道

本文介绍了如何充分利用软件工程的架构模式、设计模式和原则来实现一个高可用、可靠并且高效的机器学习系统。

如何用Delta-p统计量解释Logistic回归模型
如何用 Delta-p 统计量解释 Logistic 回归模型

在本文中,作者Maarit Widmann和Alfredo Roccato讨论了如何使用基于Delta-p统计量的解决方案来预测信贷资格。

模型评估专题_资料-InfoQ中文网