Roy West. “Hierarchical World-Model Reinforcement Learning for Long-Horizon Reasoning in Large Language Model Agents”. International Journal of Artificial Intelligence Research, vol. 1, no. 2, May 2026, https://isipress.org/index.php/IJAIR/article/view/175.