Research2026-05-12

Provable Anytime Ensemble Sampling Algorithms in Nonlinear Contextual Bandits

arXiv:2510.10730v2 Announce Type: replace-cross Abstract: We provide a unified algorithmic framework for ensemble sampling in nonlinear contextual bandits and develop corresponding regret bounds for two most common nonlinear contextual bandit settings: Generalized Linear Ensemble Sampling (GLM-ES)...

Read Original Article on Arxiv CS.AI

arxivpapers