AgentBench: Evaluating LLMs as Agents

多维度评估LLM作为智能体能力的基准测试

LLMagent

访问 AgentBench: Evaluating LLMs as Agents 官网 →

分类
对话助手
官方网址
https://huggingface.co/papers/2308.03688
最近更新
Wed Apr 08
标签
LLM · agent