[1]

Arthur Westbrook 2026. Facilitating Zero Shot Decision Generalization through Conservative Offline Reinforcement Learning and Semantic Policy Pre training with Large Language Models. International Journal of Artificial Intelligence Research. 1, 2 (May 2026). DOI:https://doi.org/10.66280/ijair.v1i2.151.