Joy RL:强化学习实践教程在线阅读
会员

Joy RL:强化学习实践教程

江季 王琦 杨毅远
开会员,本书免费读 >

计算机网络人工智能7.8万字

更新时间:2025-05-19 16:15:54 最新章节:第12章

立即阅读
加书架
下载
听书

书籍简介

本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

江季 王琦 杨毅远
主页

最新上架

  • 本书深入剖析了中国人工智能崛起的神秘力量——DeepSeek,全面解读了其背后的技术逻辑、商业模式以及对未来社会的深远影响。通过对开源与闭源之争的探讨,以及对中美人工智能领域领袖人物不同战略思考的剖析,作者揭示了人工智能技术背后的复杂性,勾勒出技术进化的脉络,并勾画出产业未来发展的路径。书中还特别关注了中国在成本结构等方面的独特优势,展现了中国在全球人工智能竞争中的地位与潜力。本书会深入浅出地介绍
    陈劲 安健计算机15.2万字
  • 会员
    本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。
    朱建明计算机16万字
  • 会员
    优化提示词是用好GPT的关键。本书基于GPT,讨论提示词的使用技巧和优化方法。本书不仅讨论如何让GPT不再“胡说八道”,如何用GPT解决各种问题,如何让GPT了解用户的需求,如何让GPT记忆力超群,还讲述如何应用GPT,如何让GPT自动运行,如何打造商业级别的GPT,如何辨别GPT生成的内容。无论你是职场人士,还是在校大学生,通过阅读本书,都可以掌握用好GPT的关键,提升自己的工作或学习效率。
    梁成睿计算机8.5万字
  • 会员
    本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章,分为五部分。第一部分(第1章)介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景,并深入探讨了AI对法律行业带来的影响等。第二部分(第2~6章)针对法律人的主要工作任务,包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等,详细讲解了应该如何使用AI来提升工作效率。第三部分(第7
    张萌 李小武 兰洋 陈中泽等计算机23.8万字
  • 会员
    AI时代的高效指南,一本在手,技术全有!从入门到精通,掌握DeepSeek实战应用!AIGC应用博士郭子璇倾力打造,权威解读,系统梳理DeepSeek技术,基础到进阶一网打尽!实战为王,全书包含丰富案例+操作指南,覆盖职场、学习、创意等场景,真正提升效率!内容零基础友好,同时提供高阶技巧,一本书满足不同层次读者的学习需求!本书是国内首本深度解析DeepSeek的实用指南,旨在帮助读者从零基础快速进
    郭子璇计算机6.8万字
  • 会员
    本书是一本专为DeepSeek使用者打造的提示词速查手册,按照高频使用场景进行分类,精选了工作、学习、生活、社交、专业咨询等五大场景高频使用的高质量提示词,同时附赠全场景提示词电子版,让您能够随时随地调用适合当下需求的指令。每个提示词均附带场景介绍、使用说明及变体建议,帮助您更好地理解和灵活运用。同时,我们也提供了一系列高级技巧,帮助您掌握创建高效提示词的方法论。这不仅是一本指令集,更是提升AI协
    贝拉计算机7.9万字
  • 会员
    本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型
    文亮 江维计算机12.2万字
  • 会员
    本书以“从入门到精通”为逻辑主线,从基础操作指南到提示词深度优化,系统拆解DeepSeek的核心能力。书中给出的100个DeepSeek实用技巧,既讲究由浅入深,又讲究实战落地,从0到1教你如何让DeepSeek帮你提高效率:针对办公、创作、营销等高频场景,提炼文档处理、工具应用等实战技巧;聚焦金融、教育、交通等七大行业,解析AI技术落地场景与解决方案;同时介绍了本地部署、智能体开发等应用指南,通
    王吉斌 祝丽丽 吴佳莹等计算机12.7万字
  • 会员
    本书采用实战教学的方式,系统介绍DeepSeek的相关知识和高效应用技巧。本书共6章,第1章为基础知识,引导读者快速入门DeepSeek;第2章为写作辅导,介绍DeepSeek在文字创作领域的实际应用;第3章聚焦于职场提效,介绍DeepSeek在职场中的多样化应用;第4章着重于学习跃升,介绍如何利用DeepSeek助力知识获取与互动式学习等;第5章综合生活中的大小事宜,介绍DeepSeek在旅行规
    葛明涛编著计算机8.9万字