会员
深度强化学习理论与实践
龙强 章胜编著计算机网络/计算机理论、基础知识· 12.5万字
更新时间:2024-12-27 22:26:05
最新章节:参考文献开会员,本书免费读 >
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。
品牌:清华大学
上架时间:2023-03-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
深度强化学习理论与实践最新章节
查看全部- 参考文献
- 9.5 AlphaGo系列算法的应用与启示
- 9.4.3 MuZero的算法流程
- 9.4.2 MuZero中的MCTS
- 9.4.1 MuZero中的深度神经网络
- 9.4 MuZero算法介绍
- 9.3.3 AlphaZero的算法流程
- 9.3.2 AlphaZero相对于AlphaGo Zero的改进与调整
- 9.3.1 从围棋到其他棋类需要解决的问题
- 9.3 AlphaZero算法介绍
龙强 章胜编著
主页
同类热门书
最新上架
- 会员
深度强化学习理论与实践
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍计算机12.5万字 - 会员
深度强化学习:算法原理与金融实践入门
深度强化学习是人工智能和机器学习的重要分支领域,有着广泛应用,如AlphaGo和ChatGPT。本书作为该领域的入门教材,在内容上尽可能覆盖深度强化学习的基础知识和经典算法。全书共10章,大致分为4部分:第1部分(第1~2章)介绍深度强化学习背景(智能决策、人工智能和机器学习);第2部分(第3~4章)介绍深度强化学习基础知识(深度学习和强化学习);第3部分(第5~9章)介绍深度强化学习经典算法(D计算机16.9万字 - 会员
偏最小二乘法优化及其在中医药领域的应用研究
本书内容是在充分利用偏最小二乘原理优势的基础上,重点研究改进与优化偏最小二乘的不足方面,使其更好地适应中医药数据分析。主要内容包括分别引入非径向数据包络分析和降噪稀疏自编码器优化偏最小二乘的噪声处理,使其处理缺失值和噪声更有效;分别引入特征相关、L1正则项和灰色关联优化偏最小二乘的特征提取,实现有效降维和提取特征子集;分别融合受限玻尔兹曼机、稀疏自编码器、深度置信网络提取非线性成分,优化偏最小二乘计算机10.5万字 - 会员
文档处理与排版标准教程(Word+InDesign)
本书以简洁的语言介绍了使用Word和InDesign编辑与排版文档所需掌握的主要功能、操作方法和实用技巧。本书提供了动手实践案例实战疑难解答几个栏目,以便增强学习效果,使读者可以更好地将理论知识与实践相结合。本书共9章,内容分为Word和InDesign两部分:Word部分中的内容主要包括文档基本操作和页面设置、文本编辑和格式设置、创建和设置表格、插入和设置图片、图文表混排、创建和使用样式与模板、计算机9.9万字 - 会员
Access数据库基础与应用标准教程(实战微课版)
本书以理论为基础,以应用为导向,用大量的实例对Access数据库的应用进行全面讲解。全书共8章,主要内容包括数据库的基础知识、Access的基本操作、表的构建、查询的创建、窗体的设计、报表的设计、宏的自动化操作,以及数据库文件的管理。知识点覆盖《全国计算机等级考试二级Access数据库程序设计》考试大纲规定的内容。在介绍Access操作方法的同时,安排大量的动手练案例,并且穿插知识延伸小体例,理论计算机8.5万字 - 会员
剪映短视频剪辑与运营标准教程(全彩微课版)
《剪映短视频剪辑与运营标准教程(全彩微课版)》围绕剪映短视频的创作展开,由浅入深、全面系统地对短视频的拍摄、剪辑、发布、运营等环节进行介绍,不仅能让新手制作出精彩的短视频,还可以让有一定后期剪辑基础的读者掌握更多创意效果的制作方法。《剪映短视频剪辑与运营标准教程(全彩微课版)》共9章,内容包括短视频剪辑基础知识、素材拍摄技法、短视频剪辑工具—剪映的基本功能、短视频字幕处理、音效的添加、视频转场特效计算机6.3万字 - 会员
Web 3.0时代:重构科技与商业新生态
在区块链、人工智能、3D、AR等底层技术的支持下,Web3.0高速发展,获得了更多的关注。从Web1.0到Web3.0,互联网由中心化走向去中心化,由以平台为中心转向以用户为中心,经济由实体经济转向数字经济。可以说,Web3.0正在全方位赋能数字时代科技发展,重构商业模式。本书以Web3.0如何重构数字时代科技与商业新生态为切入点,面向互联网领域的创业者、从业者、企业家与投资人等。读者可以计算机12.9万字 - 会员
可持续设计:数字·多元·安全
《可持续设计:数字·多元·安全》是国际体验设计大会的演讲案例的论文集,汇聚了当下具有影响力的数位国内外知名企业的设计师、商业领袖、专家的大量实践案例与前沿学术观点,分享并解决了新兴领域所面临的新问题,为企业人员提供丰富的设计手段、方法与策略。计算机19.5万字 - 会员
测试设计思想
测试设计思想是本书的主题。针对测试的两个基本目的和五个基本问题,本书归纳了八类测试设计思想,即系统的思想、枚举的思想、准则化的思想、多样化的思想、统计的思想、冗余的思想、推理的思想、控制的思想。围绕每一类思想,本书深入讲解来自不同领域的测试设计方法、实践及理念,借此剖析如何依据该思想缓解测试的基本问题。了解这些思想,有助于读者奠定扎实的测试理论基础,适应当代研发生产活动多学科交叉、多领域融合的发展计算机20.4万字