会员
强化学习:原理与Python实现
更新时间:2019-10-11 15:10:40 最新章节:12.3 本章小结
书籍简介
全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强化学习算法,结合TensorFlow实现源码。第三部分介绍强化学习综合应用案例。
品牌:机械工业出版社
上架时间:2019-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
肖智清
- 会员本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理人工智能17.2万字
同类热门书
最新上架
- 会员《小学生Scratch创意编程(视频教学版)》采用任务制编排方式,按照课节形式设计,让学习更有节奏感。《小学生Scratch创意编程(视频教学版)》分为四部分。第一部分让读者懂得为什么学和要学什么,明白为什么而学让学习更具动力;第二部分强调基础,以项目的形式讲解每一个知识点,打牢基础才能有的放矢;第三部分从方法到方法论的提升让思维更上一层楼;第四部分通过综合项目实战,提升编程能力,提高项目分析能力计算机5.8万字
- 会员Go语言是近年来非常流行的新兴编程语言,它不仅是以太坊客户端和HyperledgerFabric区块链平台的开发语言,而且广泛应用于区块链应用的开发。本书介绍使用Go语言开发的经典联盟链项目HyperledgerFabric,它由Linux基金会管理。国外的微软、摩根大通、世界银行和国内的华为、阿里巴巴、百度、腾讯等企业都参与了Hyperledger社区的建设。本书涵盖Hyperledger计算机15.3万字
- 会员本书系统地介绍了Java语言高级程序设计内容,主要包括Java集合框架、异常处理、输入/输出流、多线程、网络编程、图形用户界面程序设计、泛型、JDBC编程、Java8新特性。本书所有知识点都结合具体实例进行分析,既注重理论介绍,又强调实际应用,从实用的角度精心设计知识结构和代码示例,同时每章后面配有相应习题。本书可作为普通高等院校计算机及相关专业Java程序设计课程的教材,也适合程序开发人员学习计算机8.8万字
- 会员《Python从入门到精通(第3版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行程序开发应该掌握的各方面技术。全书共分27章,包括初识Python、Python语言基础、运算符与表达式、流程控制语句、列表和元组、字典和集合、字符串、Python中使用正则表达式、函数、面向对象程序设计、模块、文件及目录操作、操作数据库、使用进程和线程、网络编程、异常处理及程计算机25.7万字
- 会员《Java项目驱动开发教程》是一本以项目驱动教学模式理念设计的Java入门书。全书内容以软件项目案例驱动,代码实例丰富,项目实训任务饱满,语言通俗易懂,不仅能够使读者全面掌握Java面向对象编程技术,还能够提升读者使用Java语言开发软件项目的能力。《Java项目驱动开发教程》分为3个专题,共14章,3个专题分别以面向过程版的商超购物管理系统、面向对象版的超市购物系统、端对端聊天系统为贯穿项目,内计算机8.9万字
- 会员本书为软件测试初学者量身打造,从零开始,覆盖软件公司招聘的基本要求。全书分为16章,涵盖了软件测试的核心概念、功能测试方法、Linux基础知识、MySQL数据库管理、Web自动化测试框架、HTTP接口测试、Charles抓包工具的使用、Python接口自动化测试、AI赋能软件测试,以及如何制作求职简历等内容。此外,本书还提供精选面试题及参考答案,助力读者通过面试。全书知识体系循序渐进,紧跟读者需求计算机19.1万字
- 会员《剑指JVM:虚拟机实践与性能调优》共分5篇:引言篇讲述了Java与Java虚拟机的关系,以及Java虚拟机的相关知识;第1篇讲述了运行时数据区,涉及Java内存区域的各个核心结构,以及对象创建的各种细节;第2篇讲述了垃圾收集,涉及各种收集算法、垃圾收集器;第3篇讲述了字节码与类的加载;第4篇讲述了性能监控与调优,带领读者学习Java虚拟机常用的监控与调优工具,并附有企业级的性能调优案例。计算机23万字
同类书籍最近更新
- 会员Node.js是一个基于ChromeV8引擎的JavaScript运行环境,用来编写服务器端程序。Node.js是新兴的开发工具,也是目前发展较快的开发工具之一。近几年来,随着Node.js的发展,越来越多的开发人员选择用它构建Web应用。本书较为系统地介绍了目前Node.js应用开发中涉及的基础知识和核心技术,并通过案例介绍了基于Express和Koa框架的项目开发。本书着重实际应用,案例及实程序设计10.9万字
- 会员本书从初学者的角度出发,由浅入深地讲解了Java语言的相关内容。全书共11章,主要介绍了Java开发环境的搭建及其运行机制、基本语法、面向对象编程思想、多线程、常用API、集合、I/O、网络编程等内容,采用通俗易懂的语言阐述抽象的概念,选用生活中密切相关的例子演示知识的运用,通过剖析案例、分析代码含义、解决常见问题等方式进行讲解。书中还添加了许多阶段性任务来模拟程序开发过程,帮助初学者培养良好的编程序设计10.6万字
- 会员本书将JavaWeb开发的基础知识与实例有机地结合在一起,系统地介绍JavaWeb应用开发过程中的一些实用技术、系统设计与编程思想。本书主要内容包括JavaWeb开发基础、Servlet入门、Servlet应用、JSP应用开发、JDBC数据库应用开发、EL表达式与JSTL标签、基于WebMVC框架的项目实践。全书不仅介绍理论基础,更强调实际应用。本书可作为普通高等院校计算机相关专业的教材,程序设计9.5万字
- 会员本书是布鲁斯·埃克尔时隔15年,继ThinkinginJava之后又一力作,基于Java的3个长期支持版(Java8、11、17),讲解Java核心语法,并对Java的核心变化进行详述。全书内容通俗易懂,配合示例讲解逐步深入,并结合实际开发需要,从语言底层设计出发,有效帮读者规避一些常见的开发陷阱。主体部分共22章,内容包含对象、操作符、控制流、初始化和清理、复用、多态、接口、内部类、集合、函程序设计29.4万字
- 会员本书是网页特效设计任务驱动式教材。本书将网页特效分为9类,分别是基本网页特效、日期时间类网页特效、文字类网页特效、图片类网页特效、表单控件类网页特效、导航菜单类网页特效、选项卡类网页特效、内容展开与折叠类网页特效和页面类网页特效,同时相应地将全书分为9个教学单元,每个教学单元分析和设计一种类型的网页特效,将JavaScript和jQuery的相关知识合理地安排到各个教学单元中。程序设计7.4万字
- 会员本书为适应新工科复合型人才对计算思维和问题求解能力的要求而编写。全书共12章,主要内容包括:计算思维与问题求解,数据类型、运算符和表达式,简单的C程序设计,选择结构程序设计,循环结构程序设计,函数,数组,常用算法,指针,结构体,文件系统和人工智能经典算法。本教材兼顾计算思维与程序设计基础知识,注重问题抽象,通过问题案例分析,逐步给出问题求解算法与程序实现,引导读者的算法思维和程序设计思维。通过“常程序设计13.2万字