PersonaAgent When Large Language Model Agents Meet Personalization at Test Time

どんなもの？

ユーザーごとの好みや履歴にリアルタイムで適応する personalized agent framework。

figure 1 が一番わかりやすくまとまっている。

fefd741e73e4ebe76df500fcd6e9df14

実務的な嬉しさは、

Test-Time User Preference Alignment を導入。

要するに、

LAMP-1,2,3 にて他の手法よりも優れた精度を記録。

0a925d7d4e81a5b4d1b6a0428773eaed

Ablation Study にて各パーツが全て重要であることを主張。なかでも Action がかなり重要そう？

92156d37f9f36e8a666824f47b7f8d19

プライバシーリスクあり。学習によって得られたペルソナはテキストデータで保持されるので、それが流出するとかなり大変そう（感覚としては検索履歴を覗かれるのに近いので、、、）。

有用そうだが、他の論文と比較して LaMP の精度がかなり高いのが気になる。Ours model だけが高いのではなく、RAG などの従来手法も高い。回答させるときのプロンプトも気になる。

また、LaMPの 5,6,7 のタスクの精度を検証していないのも気になる。「その人らしい選択」は実現できても、「その人らしい出力」はもしかして難しい？だとすれば、「その人らしい出力」を実現させるためのパーツを追加する必要がありそう。