【FunctionChat-Bench:对话场景下语言模型工具使用能力的评估工具,专门设计来测试语言模型在对话中调用工具的能力,包括单轮和多轮对话场景】'FunctionChat-Bench: Comphensive Evaluation of Language Model's Generative Capabilities in Korean Tool-use Dialogs' GitHub: github.com/kakao/FunctionChat-Bench
AI对话评估 语言模型 工具使用