封面
版权信息
作者简介
译者序
前言
致谢
第1章 导论
1.1 决策
1.2 应用
1.2.1 飞机防撞控制系统
1.2.2 自动驾驶控制系统
1.2.3 乳腺癌筛查
1.2.4 金融消费与投资组合配置
1.2.5 分布式森林火灾监控系统
1.2.6 火星科学探测
1.3 方法
1.3.1 显式编程
1.3.2 监督式学习
1.3.3 优化
1.3.4 规划
1.3.5 强化学习
1.4 自动化决策过程的历史
1.4.1 经济学
1.4.2 心理学
1.4.3 神经科学
1.4.4 计算机科学
1.4.5 工程
1.4.6 数学
- APP免费
1.4.7 运筹学
- APP免费
1.5 社会影响
- APP免费
1.6 本书组织结构
- APP免费
1.6.1 概率推理
- APP免费
1.6.2 序列问题
- APP免费
1.6.3 模型不确定性
- APP免费
1.6.4 状态不确定性
- APP免费
1.6.5 多智能体系统
- APP免费
第一部分 概率推理
- APP免费
第2章 表示
- APP免费
2.1 信念度和概率
- APP免费
2.2 概率分布
- APP免费
2.2.1 离散概率分布
- APP免费
2.2.2 连续概率分布
- APP免费
2.3 联合分布
- APP免费
2.3.1 离散联合分布
- APP免费
2.3.2 连续联合分配
- APP免费
2.4 条件分布
- APP免费
2.4.1 离散条件模型
- APP免费
2.4.2 条件高斯模型
- APP免费
2.4.3 线性高斯模型
- APP免费
2.4.4 条件线性高斯模型
- APP免费
2.4.5 sigmoid模型
- APP免费
2.4.6 确定性变量
- APP免费
2.5 贝叶斯网络
- APP免费
2.6 条件独立性
- APP免费
2.7 本章小结
- APP免费
2.8 练习题
- APP免费
第3章 推理
- APP免费
3.1 贝叶斯网络中的推理
- APP免费
3.2 朴素贝叶斯模型中的推理
- APP免费
3.3 “和-积”变量消除
- APP免费
3.4 信念传播
- APP免费
3.5 计算复杂度
- APP免费
3.6 直接抽样
- APP免费
3.7 似然加权抽样
- APP免费
3.8 吉布斯抽样
- APP免费
3.9 高斯模型中的推理
- APP免费
3.10 本章小结
- APP免费
3.11 练习题
- APP免费
第4章 参数学习
- APP免费
4.1 最大似然参数学习
- APP免费
4.1.1 类别分布的最大似然估计
- APP免费
4.1.2 高斯分布的最大似然估计
- APP免费
4.1.3 贝叶斯网络的最大似然估计
- APP免费
4.2 贝叶斯参数学习
- APP免费
4.2.1 二元分布的贝叶斯学习
- APP免费
4.2.2 类别分布的贝叶斯学习
- APP免费
4.2.3 贝叶斯网络的贝叶斯学习
- APP免费
4.3 非参数学习
- APP免费
4.4 缺失数据的学习
- APP免费
4.4.1 数据插值
- APP免费
4.4.2 期望最大化
- APP免费
4.5 本章小结
- APP免费
4.6 练习题
- APP免费
第5章 结构学习
- APP免费
5.1 贝叶斯网络评分
- APP免费
5.2 有向图搜索
- APP免费
5.3 马尔可夫等价类
- APP免费
5.4 部分有向图搜索
- APP免费
5.5 本章小结
- APP免费
5.6 练习题
- APP免费
第6章 简单决策
- APP免费
6.1 理性偏好上的约束
- APP免费
6.2 效用函数
- APP免费
6.3 效用诱导
- APP免费
6.4 最大期望效用原则
- APP免费
6.5 决策网络
- APP免费
6.6 信息价值
- APP免费
6.7 非理性
- APP免费
6.8 本章小结
- APP免费
6.9 练习题
- APP免费
第二部分 序列问题
- APP免费
第7章 精确求解方法
- APP免费
7.1 马尔可夫决策过程
- APP免费
7.2 策略评估
- APP免费
7.3 值函数策略
- APP免费
7.4 策略迭代
- APP免费
7.5 值迭代
- APP免费
7.6 异步值迭代
- APP免费
7.7 线性规划方程
- APP免费
7.8 具有二次型奖励的线性系统
- APP免费
7.9 本章小结
- APP免费
7.10 练习题
- APP免费
第8章 近似值函数
- APP免费
8.1 参数化表示
- APP免费
8.2 最近邻
- APP免费
8.3 核平滑
- APP免费
8.4 线性插值
- APP免费
8.5 单纯形插值
- APP免费
8.6 线性回归
- APP免费
8.7 神经网络回归
- APP免费
8.8 本章小结
- APP免费
8.9 练习题
- APP免费
第9章 在线规划
- APP免费
9.1 滚动时域规划
- APP免费
9.2 基于预演的前瞻算法
- APP免费
9.3 正向搜索
- APP免费
9.4 分支定界法
- APP免费
9.5 稀疏抽样
- APP免费
9.6 蒙特卡罗树搜索
- APP免费
9.7 启发式搜索
- APP免费
9.8 标记启发式搜索
- APP免费
9.9 开环规划
- APP免费
9.9.1 确定性模型预测控制
- APP免费
9.9.2 鲁棒模型预测控制
- APP免费
9.9.3 多重预测模型预测控制
- APP免费
9.10 本章小结
- APP免费
9.11 练习题
- APP免费
第10章 策略搜索
- APP免费
10.1 近似策略评估
- APP免费
10.2 局部搜索
- APP免费
10.3 遗传算法
- APP免费
10.4 交叉熵方法
- APP免费
10.5 进化策略
- APP免费
10.6 各向同性进化策略
- APP免费
10.7 本章小结
- APP免费
10.8 练习题
- APP免费
第11章 策略梯度值的估算
- APP免费
11.1 有限差分
- APP免费
11.2 回归梯度
- APP免费
11.3 似然比
- APP免费
11.4 “之后的奖励”方法
- APP免费
11.5 基线扣除法
- APP免费
11.6 本章小结
- APP免费
11.7 练习题
- APP免费
第12章 策略梯度的优化
- APP免费
12.1 梯度上升更新
- APP免费
12.2 带约束条件的梯度更新
- APP免费
12.3 自然梯度更新
- APP免费
12.4 信任区域更新
- APP免费
12.5 剪裁代理目标
- APP免费
12.6 本章小结
- APP免费
12.7 练习题
- APP免费
第13章 “行为者-评论家”方法
- APP免费
13.1 “行为者-评论家”
- APP免费
13.2 广义优势估计
- APP免费
13.3 确定性策略梯度
- APP免费
13.4 蒙特卡罗树搜索的“行为者-评论家”
- APP免费
13.5 本章小结
- APP免费
13.6 练习题
- APP免费
第14章 策略验证
- APP免费
14.1 性能指标评估
- APP免费
14.2 罕见事件模拟
- APP免费
14.3 鲁棒性分析
- APP免费
14.4 权衡分析
- APP免费
14.5 对抗性分析
- APP免费
14.6 本章小结
- APP免费
14.7 练习题
- APP免费
第三部分 模型不确定性
- APP免费
第15章 探索和利用
- APP免费
15.1 赌博机问题
- APP免费
15.2 贝叶斯模型估计
- APP免费
15.3 无向探索策略
- APP免费
15.4 有向探索策略
- APP免费
15.5 最佳探索策略
- APP免费
15.6 使用多个状态进行探索
- APP免费
15.7 本章小结
- APP免费
15.8 练习题
- APP免费
第16章 基于模型的方法
- APP免费
16.1 最大似然模型
- APP免费
16.2 更新方案
- APP免费
16.2.1 完整更新
- APP免费
16.2.2 随机更新
- APP免费
16.2.3 优先更新
- APP免费
16.3 探索策略
- APP免费
16.4 贝叶斯方法
- APP免费
16.5 贝叶斯自适应马尔可夫决策过程
- APP免费
16.6 后验抽样
- APP免费
16.7 本章小结
- APP免费
16.8 练习题
- APP免费
第17章 无模型的方法
- APP免费
17.1 均值的增量估计
- APP免费
17.2 Q-学习
- APP免费
17.3 Sarsa
- APP免费
17.4 资格迹
- APP免费
17.5 奖励塑形
- APP免费
17.6 行为值函数近似
- APP免费
17.7 经验回放
- APP免费
17.8 本章小结
- APP免费
17.9 练习题
- APP免费
第18章 模仿学习
- APP免费
18.1 行为克隆
- APP免费
18.2 数据集聚合
- APP免费
18.3 随机混合迭代学习
- APP免费
18.4 最大边际逆向强化学习
- APP免费
18.5 最大熵逆向强化学习
- APP免费
18.6 生成式对抗性模仿学习
- APP免费
18.7 本章小结
- APP免费
18.8 练习题
- APP免费
第四部分 状态不确定性
- APP免费
第19章 信念
- APP免费
19.1 信念初始化
- APP免费
19.2 离散状态滤波器
- APP免费
19.3 卡尔曼滤波器
- APP免费
19.4 扩展卡尔曼滤波器
- APP免费
19.5 无迹卡尔曼滤波器
- APP免费
19.6 粒子滤波器
- APP免费
19.7 粒子注入
- APP免费
19.8 本章小结
- APP免费
19.9 练习题
- APP免费
第20章 精确信念状态规划
- APP免费
20.1 信念-状态马尔可夫决策过程
- APP免费
20.2 条件规划
- APP免费
20.3 阿尔法向量
- APP免费
20.4 剪枝
- APP免费
20.5 值迭代
- APP免费
20.6 线性策略
- APP免费
20.7 本章小结
- APP免费
20.8 练习题
- APP免费
第21章 离线信念状态规划
- APP免费
21.1 完全可观测值的近似
- APP免费
21.2 快速通知界限
- APP免费
21.3 快速下界
- APP免费
21.4 基于点的值迭代
- APP免费
21.5 基于随机点的值迭代
- APP免费
21.6 锯齿上界
- APP免费
21.7 点选择
- APP免费
21.8 锯齿启发式搜索
- APP免费
21.9 三角化的值函数
- APP免费
21.10 本章小结
- APP免费
21.11 练习题
- APP免费
第22章 在线信念状态规划
- APP免费
22.1 具有预演的前瞻策略
- APP免费
22.2 正向搜索
- APP免费
22.3 分支定界法
- APP免费
22.4 稀疏抽样
- APP免费
22.5 蒙特卡罗树搜索
- APP免费
22.6 确定性稀疏树搜索
- APP免费
22.7 间隙启发式搜索
- APP免费
22.8 本章小结
- APP免费
22.9 练习题
- APP免费
第23章 控制器抽象
- APP免费
23.1 控制器
- APP免费
23.2 策略迭代
- APP免费
23.3 非线性规划
- APP免费
23.4 梯度上升
- APP免费
23.5 本章小结
- APP免费
23.6 练习题
- APP免费
第五部分 多智能体系统
- APP免费
第24章 多智能体推理
- APP免费
24.1 简单博弈
- APP免费
24.2 响应模型
- APP免费
24.2.1 最优响应
- APP免费
24.2.2 Softmax响应
- APP免费
24.3 主导策略均衡
- APP免费
24.4 纳什均衡
- APP免费
24.5 相关均衡
- APP免费
24.6 迭代式最优响应
- APP免费
24.7 层次化Softmax
- APP免费
24.8 虚构博弈
- APP免费
24.9 梯度上升
- APP免费
24.10 本章小结
- APP免费
24.11 练习题
- APP免费
第25章 序列问题
- APP免费
25.1 马尔可夫博弈
- APP免费
25.2 响应模型
- APP免费
25.2.1 最优响应
- APP免费
25.2.2 Softmax响应
- APP免费
25.3 纳什均衡
- APP免费
25.4 虚构博弈
- APP免费
25.5 梯度上升
- APP免费
25.6 纳什Q-学习
- APP免费
25.7 本章小结
- APP免费
25.8 练习题
- APP免费
第26章 状态不确定性
- APP免费
26.1 部分可观测马尔可夫博弈
- APP免费
26.2 策略评估
- APP免费
26.2.1 评估条件规划
- APP免费
26.2.2 评估随机控制器
- APP免费
26.3 纳什均衡
- APP免费
26.4 动态规划
- APP免费
26.5 本章小结
- APP免费
26.6 练习题
- APP免费
第27章 协作智能体
- APP免费
27.1 分散的部分可观测马尔可夫决策过程
- APP免费
27.2 Dec-POMDP的子类别
- APP免费
27.3 动态规划
- APP免费
27.4 迭代式最优响应
- APP免费
27.5 启发式搜索
- APP免费
27.6 非线性规划
- APP免费
27.7 本章小结
- APP免费
27.8 练习题
- APP免费
附录
- APP免费
附录A 数学概念
- APP免费
A.1 测度空间
- APP免费
A.2 概率空间
- APP免费
A.3 度量空间
- APP免费
A.4 赋范向量空间
- APP免费
A.5 正定性
- APP免费
A.6 凸性
- APP免费
A.7 信息量
- APP免费
A.8 熵
- APP免费
A.9 交叉熵
- APP免费
A.10 相对熵
- APP免费
A.11 梯度上升
- APP免费
A.12 泰勒展开式
- APP免费
A.13 蒙特卡罗估计方法
- APP免费
A.14 重要性采样技术
- APP免费
A.15 收缩映射
- APP免费
A.16 图
- APP免费
附录B 概率分布
- APP免费
附录C 计算复杂度
- APP免费
C.1 渐近表示法
- APP免费
C.2 时间复杂度的级别
- APP免费
C.3 空间复杂度的级别
- APP免费
C.4 可判定性
- APP免费
附录D 神经网络表示
- APP免费
D.1 神经网络
- APP免费
D.2 前馈网络
- APP免费
D.3 参数正则化
- APP免费
D.4 卷积神经网络
- APP免费
D.5 循环神经网络
- APP免费
D.6 自动编码器神经网络
- APP免费
D.7 对抗式神经网络
- APP免费
附录E 搜索算法
- APP免费
E.1 搜索问题
- APP免费
E.2 搜索图
- APP免费
E.3 正向搜索
- APP免费
E.4 分支定界法
- APP免费
E.5 动态规划
- APP免费
E.6 启发式搜索
- APP免费
附录F 决策问题
- APP免费
F.1 六边形世界问题
- APP免费
F.2 2048问题
- APP免费
F.3 “推车-竖杆”问题
- APP免费
F.4 山地车问题
- APP免费
F.5 简单调节器问题
- APP免费
F.6 飞机防撞问题
- APP免费
F.7 哭闹的婴儿问题
- APP免费
F.8 机器更换问题
- APP免费
F.9 接球问题
- APP免费
F.10 囚徒的困境
- APP免费
F.11 “石头、剪刀、布”问题
- APP免费
F.12 旅行者困境问题
- APP免费
F.13 “捕食者-猎物”六边形世界问题
- APP免费
F.14 包含多位护理者的哭闹的婴儿问题
- APP免费
F.15 协作式“捕食者-猎物”六边形世界问题
- APP免费
附录G Julia
- APP免费
G.1 数据类型
- APP免费
G.1.1 布尔类型
- APP免费
G.1.2 数值类型
- APP免费
G.1.3 字符串
- APP免费
G.1.4 符号
- APP免费
G.1.5 向量
- APP免费
G.1.6 矩阵
- APP免费
G.1.7 元组
- APP免费
G.1.8 命名元组
- APP免费
G.1.9 字典
- APP免费
G.1.10 组合类型
- APP免费
G.1.11 抽象类型
- APP免费
G.1.12 参数化类型
- APP免费
G.2 函数
- APP免费
G.2.1 命名函数
- APP免费
G.2.2 匿名函数
- APP免费
G.2.3 可调用对象
- APP免费
G.2.4 可选参数
- APP免费
G.2.5 关键字参数
- APP免费
G.2.6 调度分派
- APP免费
G.2.7 解包
- APP免费
G.3 控制流程
- APP免费
G.3.1 条件求值
- APP免费
G.3.2 循环
- APP免费
G.3.3 迭代器
- APP免费
G.4 包
- APP免费
G.4.1 Graphs.jl
- APP免费
G.4.2 Distributions.jl
- APP免费
G.4.3 JuMP.jl
- APP免费
G.5 实用函数
- APP免费
参考文献
- APP免费
推荐阅读
- APP免费
译者简介
- APP免费
封底
更新时间:2024-10-29 18:35:53