LaMP
個別化された出力を行う AIエージェントを評価するベンチマーク。
論文:
LaMP: When Large Language Models Meet Personalization
Alireza Salemi, Sheshera Mysore, Michael Bendersky, Hamed Zamani. Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2024.

LaMP-QA という、質問返答に特化したベンチマークデータセットもある(後で読む)