艾恩导航
  • 首页
  • 聚合搜索
  • 古风汉服
      • 未登录
        登录后即可体验更多功能
    • 首页
    • 聚合搜索
    • 古风汉服
    未登录
    登录后即可体验更多功能

    AI模型评测

    共 13 篇网址
    排序
    发布更新浏览点赞
    FlagEval

    FlagEval

    智源研究院推出的FlagEval(天秤)大模型评测平台
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    H2O EvalGPT

    H2O EvalGPT

    H2O.ai推出的基于Elo评级方法的大模型评估系统
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    HELM

    HELM

    斯坦福大学推出的大模型评测体系
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    LLMEval3

    LLMEval3

    由复旦大学NLP实验室推出的大模型评测基准
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    MMLU

    MMLU

    大规模多任务语言理解基准
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    Open LLM Leaderboard

    Open LLM Leaderboard

    Hugging Face推出的开源大模型排行榜单
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    Chatbot Arena

    Chatbot Arena

    以众包方式进行匿名随机对战的LLM基准平台
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    MMBench

    MMBench

    全方位的多模态大模型能力评测体系
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    OpenCompass

    OpenCompass

    上海人工智能实验室推出的大模型开放评测体系
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    C-Eval

    C-Eval

    一个全面的中文基础模型评估套件
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    SuperCLUE

    SuperCLUE

    中文通用大模型综合性测评基准
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    PubMedQA

    PubMedQA

    生物医学研究问答数据集和模型得分排行榜
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    CMMLU

    CMMLU

    一个综合性的大模型中文评估基准
    0
    AI开放平台模型评测# AIGC# AI导航# AI模型评测
    没有了
    艾恩导航
    艾恩导航,是一个集网址导航、资源、资讯攻略于一体的网址导航网站。

    书签导航清凉主页聚合搜索AI古风

    Copyright © 2025 艾恩导航 滇ICP备2024037199号-4 由 OneNav 强力驱动 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍