Arthur Westbrook. “Facilitating Zero Shot Decision Generalization through Conservative Offline Reinforcement Learning and Semantic Policy Pre Training With Large Language Models”. International Journal of Artificial Intelligence Research, vol. 1, no. 2, May 2026, doi:10.66280/ijair.v1i2.151.