Research2026-05-12

G-Zero: Self-Play for Open-Ended Generation from Zero Data

arXiv:2605.09959v1 Announce Type: cross Abstract: Self-evolving LLMs excel in verifiable domains but struggle in open-ended tasks, where reliance on proxy LLM judges introduces capability bottlenecks and reward hacking. To overcome this, we introduce G-Zero, a verifier-free, co-evolutionary...

Read Original Article on Arxiv CS.AI

arxivpapers