(1)

Arthur Westbrook. Facilitating Zero Shot Decision Generalization through Conservative Offline Reinforcement Learning and Semantic Policy Pre Training With Large Language Models. IJAIR 2026, 1.