Research2026-05-05

DynamicPO: Dynamic Preference Optimization for Recommendation

arXiv:2605.00327v1 Announce Type: cross Abstract: In large language model (LLM)-based recommendation systems, direct preference optimization (DPO) effectively aligns recommendations with user preferences, requiring multi-negative objective functions to leverage abundant implicit-feedback negatives...

Read Original Article on Arxiv CS.AI

arxivpapers