



首页

AI应用广场

AI算法库

AI教程专区

AI创新社区

AI资讯速递

AI案例展示

AI教程资讯

HELM

HELM

发布时间：2024-12-25 17:46:18

AI算法库
4分

访问官网

简介

HELM全称Holistic Evaluation of Language Models（语言模型整体评估）是由斯坦福大学推出的大模型评测体系，该评测方法主要包括场景、适配、指标三个模块，每次评测的运行都需要指定一个场景，一个适配模型的提示，以及一个或多个指标。它评测主要覆盖的是英语，有7个指标，包括准确率、不确定性/校准、鲁棒性、公平性、偏差、毒性、推断效率；任务包括问答、信息检索、摘要、文本分类等。

AI教程资讯

突发！腾讯、宁德时代等被列入美国防部黑名单，旷视科技被放出！最新回应来了 2025-01-08

智源一次性发布超 100 个大模型评测结果，文本到视频等多模态领域全覆盖 2025-01-07

“为Perplexity付费已没有意义！”谷歌搜索反击，发布最有“谷歌风格”的AI应用！ 2025-01-07

F5 预测：2025年亚太地区企业AI应用的五大趋势 2025-01-07

被 AI 分掉精力的数学天才陶哲轩，论文被拒了 2025-01-07

同类推荐更多 

AI Content Detector     

AI算法库

GPT Detector     

AI算法库

Sapling AI Content Detector     

AI算法库

Winston AI     

AI算法库

AISEO AI Content Detector     

AI算法库

人气推荐更多 

GPT-4

Stable Diffusion

Ollama

Auto-GPT

腾讯混元大模型

BLOOM

StableLM

Gradio

热点资讯

Copyright 2015-2025 //www.aidown.cc/ All Rights Reserved.

所有文章内容都来自于网络上传，如有侵权请联系删除