ARTHUR WESTBROOK. Facilitating Zero Shot Decision Generalization through Conservative Offline Reinforcement Learning and Semantic Policy Pre training with Large Language Models. International Journal of Artificial Intelligence Research, [S. l.], v. 1, n. 2, 2026. DOI: 10.66280/ijair.v1i2.151. Disponível em: https://isipress.org/index.php/IJAIR/article/view/151. Acesso em: 14 may. 2026.