Roy West. Hierarchical World-Model Reinforcement Learning for Long-Horizon Reasoning in Large Language Model Agents. IJAIR [Internet]. 2026 May 25 [cited 2026 May 28];1(2). Available from: https://isipress.org/index.php/IJAIR/article/view/175