发布时间:2024-12-26 09:13:36
简介
MMBench是一个多模态基准测试,由上海人工智能实验室、南洋理工大学、香港中文大学、新加坡国立大学和浙江大学的研究人员推出。该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。
AI Content Detector
AI算法库
GPT Detector
Sapling AI Content Detector
Winston AI
AISEO AI Content Detector
GPT-4
Stable Diffusion
Ollama
Auto-GPT
腾讯混元大模型
BLOOM
StableLM
Gradio