AI聚合信息网 AI聚合信息网 AI聚合信息网 AI聚合信息网
  • AI资讯
  • AI社区
  • 热门工具
  • 最新收录
  • AI对话工具
  • AI文本工具
    • AI写作工具
    • AI提示指令
    • AI摘要生成
    • AI论文写作
    • AI语言翻译
    • AI阅读助手
    • AI内容检测
    • AI邮件助手
    • AI知识库问答
  • AI图像工具
    • 常用AI图像工具
    • AI图片插画生成
    • AI商品图生成
    • AI图片无损放大
    • AI图片优化修复
    • AI图片物体抹除
    • AI图片背景移除
  • AI音频工具
    • 常用AI音频工具
    • AI同传翻译
    • AI声音克隆
    • AI声音分离
    • AI歌手/虚拟歌姬
    • AI语音合成
    • AI语音转文字
    • AI音乐创作
  • AI视频工具
    • 常用AI视频工具
    • 视频剪辑
    • AI生成视频
    • AI虚拟数字人
    • AI视频总结
    • AI加字幕/AI字幕翻译
  • AI办公工具
    • AI文档工具
    • AI表格数据处理
    • AI幻灯片和演示
    • AI效率提升
    • AI会议工具
    • AI思维导图
    • AI求职简历
    • AI法律助手
    • AI金融事务
  • AI编程工具
    • 常用AI编程工具
    • 代码审计和管理
    • 开发和部署
    • 测试和调试
    • 设计和网站构建
    • AI辅助编程
    • AI开源项目
    • AI应用接口API
    • AI向量数据库
  • AI设计工具
    • 常用AI设计工具
    • AI logo设计
    • 原型设计
    • 图片设计
    • 色彩工具
    • 虚拟和3D设计
  • AI学习网站
  • AI开发框架
  • AI搜索引擎
  • AI模型评测
  • AI训练模型
  • AI游戏应用
    • AI游戏
    • AI游戏开发
    • AI游戏素材
    • AI元宇宙
  • AI权威机构
    • AI相关协会
    • AI管理机构
    • AI官方活动
AI聚合信息网 AI聚合信息网

    AI模型评测

    PubMedQA

    生物医学研究问答数据集和模型得分排行榜

    H2O EvalGPT

    H2O.ai推出的基于Elo评级方法的大模型评估系统

    LLMEval3

    由复旦大学NLP实验室推出的大模型评测基准

    Chatbot Arena

    以众包方式进行匿名随机对战的LLM基准平台

    HELM

    斯坦福大学推出的大模型评测体系

    MMBench

    全方位的多模态大模型能力评测体系

    CMMLU

    一个综合性的大模型中文评估基准

    SuperCLUE

    中文通用大模型综合性测评基准

    OpenCompass

    上海人工智能实验室推出的大模型开放评测体系

    FlagEval

    智源研究院推出的FlagEval(天秤)大模型评测平台

    C-Eval

    一个全面的中文基础模型评估套件

    Open LLM Leaderboard

    Hugging Face推出的开源大模型排行榜单

    MMLU

    大规模多任务语言理解基准

    添加小工具
    点此为“分类归档侧边栏”添加小工具
    Copyright © 2025 AI聚合信息网