LaMP
LaMP favicon https://lamp-benchmark.github.io/

個別化された出力を行う AIエージェントを評価するベンチマーク。

論文:

LaMP: When Large Language Models Meet Personalization
Alireza Salemi, Sheshera Mysore, Michael Bendersky, Hamed Zamani. Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2024.
LaMP: When Large Language Models Meet Personalization favicon https://aclanthology.org/2024.acl-long.399/
LaMP: When Large Language Models Meet Personalization

4029c03d765b69b0bd780de7959a9b4e

各タスクの中身はこんな感じ

LaMP-QA という、質問返答に特化したベンチマークデータセットもある(後で読む)