Arthur Westbrook. “Facilitating Zero Shot Decision Generalization through Conservative Offline Reinforcement Learning and Semantic Policy Pre Training With Large Language Models”. International Journal of Artificial Intelligence Research 1, no. 2 (May 13, 2026). Accessed May 14, 2026. https://isipress.org/index.php/IJAIR/article/view/151.