登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日
大書城 以“ 全文 模式”搜“ [美]德梅萃·P 博赛卡斯[Dimitri P Berts ”共有 8 結果: 支援简体 / 繁體 / 正體字輸入搜索
强化学习与最优控制 强化学习与最优控制
作者:[美]德梅萃·P.,博赛卡斯[Dimitri P.,Bert  出版:清华大学出版社  日期:2020-06-01
本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和*控制来解决,但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于*控制和人工智能思想的相互作用。本书的目 ...
詳情>>
售價:NT$ 894

抽象动态规划(第2版) 抽象动态规划(第2版)
作者:[美]德梅萃·P.博赛卡斯[Dimitri P. Berts  出版:清华大学出版社  日期:2022-04-01
第2版的主要目的是扩大第1版(2013)的第3章和第4章的半契约模型的内容,并以自第1版以来作者在期刊和报告中发表的研究成果作为补充。这本书的数学内容非常优雅且严格,依靠抽象的力量专注于基础知识。该书首次提供了该领域的全面综合知识,同时提出了许多新研究,其中一些研究与当前非常活跃的领域(如近似动态编程)有关。本书中散布 ...
詳情>>
售價:NT$ 454

策略前展、策略迭代与分布式强化学习 策略前展、策略迭代与分布式强化学习
作者:[美]德梅萃·P. 博赛卡斯[Dimitri P. Bert  出版:清华大学出版社  日期:2022-04-01
本书目的是从作者近出版的《强化学习预控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题(例如路由,调度,分配和混合整数编程)中的应用,包括在这些情况下使用神经网络近似。 本书可作为计算机科学与技术、控制科学与技术、 ...
詳情>>
售價:NT$ 709

动态规划与最优控制——近似动态规划(第I卷) 动态规划与最优控制——近似动态规划(第I卷)
作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert  出版:清华大学出版社  日期:2024-05-01
本书系统性介绍动态规划与最优控制,包括动态规划算法、确定性系统与随机最短路问题、确定性连续时间最优控制、状态信息完整的问题、状态信息缺失的问题、次优与适应控制、无穷阶段问题等。 ...
詳情>>
售價:NT$ 505

阿尔法零对最优模型预测自适应控制的启示 阿尔法零对最优模型预测自适应控制的启示
作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert  出版:清华大学出版社  日期:2024-06-01
大致内容:第一章,从阿尔法零的卓越性能出发,深入解读其背后着实不易的成长历程,揭示其数学模型。第二章,从确定性和随机动态规划问题入手,介绍决策问题的数学模型。第三章,从抽象视角回顾纷繁复杂的强化学习算法,揭示值函数近似与滚动改进的重要作用。第四章,从经典的线性二次型最优控制问题入手,分析从阿尔法零的成功中学到的经验。第 ...
詳情>>
售價:NT$ 352

阿尔法零对最优模型预测自适应控制的启示 阿尔法零对最优模型预测自适应控制的启示
作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert  出版:清华大学出版社  日期:2025-04-01
第一章,从阿尔法零的卓越性能出发,深入解读其背后着实不易的成长历程,揭示其数学模型。第二章,从确定性和随机动态规划问题入手,介绍决策问题的数学模型。第三章,从抽象视角回顾纷繁复杂的强化学习算法,揭示值函数近似与滚动改进的重要作用。第四章,从经典的线性二次型最优控制问题入手,分析从阿尔法零的成功中学到的经验。第五章,分别 ...
詳情>>
售價:NT$ 403

强化学习与最优控制 强化学习与最优控制
作者:[美]德梅萃·P. 博塞克斯[Dimitri P. Bert  出版:清华大学出版社  日期:2024-04-01
本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和最优控制来解决,但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于最优控制和人工智能思想的相互作用。本书 ...
詳情>>
售價:NT$ 709

动态规划与最优控制——近似动态规划 动态规划与最优控制——近似动态规划
作者:[美]德梅萃 P.,博塞克斯[Dimitri P.,Bert  出版:清华大学出版社  日期:2021-02-01
本书系统性介绍动态规划,特别是近似动态规划,包括折扣问题的理论与计算方法、随机*短路问题、无折扣问题、平均费用问题、折扣与无折扣问题的近似动态规划等。 ...
詳情>>
售價:NT$ 748

>>> (頁碼:1/1 行數:20/8) 1  

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2025 (香港)大書城有限公司 All Rights Reserved.