"强化"的相关文档 - 文档中心

39-强化学习在自然语言处理下的应用篇.pdf
强化学习在自然语言处理下的应用篇来自：AiGC面试宝典宁静致远2024年01月27日20:47一、强化学习基础面1.1介绍一下强化学习？强化学习（Rein...
2025-02-0585571.58 KB26
下载文档
38-大模型（LLMs）强化学习—— PPO 面.pdf
大模型（LLMs）强化学习——PPO面来自：AiGC面试宝典宁静致远2024年01月27日20:47一、大语言模型RLHF中的PPO主要分哪些步骤？大语言模型RLH...
2025-02-0598270.99 KB25
下载文档
37-大模型（LLMs）强化学习——RLHF及其变种面.pdf
大模型（LLMs）强化学习——RLHF及其变种面来自：AiGC面试宝典宁静致远2024年01月27日20:47一、介绍一下LLM的经典预训练Pipeline？•大模型...
2025-02-051962.42 MB29
下载文档
36-大模型（LLMs）强化学习面.pdf
大模型（LLMs）强化学习面来自：AiGC面试宝典宁静致远2024年01月27日20:471简单介绍强化学习？强化学习：（ReinforcementLearning）一种机...
2025-02-05144277.61 KB2
下载文档