Arthur Westbrook (2026) “Facilitating Zero Shot Decision Generalization through Conservative Offline Reinforcement Learning and Semantic Policy Pre training with Large Language Models”, International Journal of Artificial Intelligence Research, 1(2). doi: 10.66280/ijair.v1i2.151.