登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2025年08月出版新書

2025年07月出版新書

2025年06月出版新書

2025年05月出版新書

2025年04月出版新書

2025年03月出版新書

2025年02月出版新書

2025年01月出版新書

2024年12月出版新書

2024年11月出版新書

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

『簡體書』基于多智能体分层强化学习的指挥决策方法研究

書城自編碼: 4138903
分類: 簡體書→大陸圖書→工業技術武器工业
作者: 殷昌盛,杨若鹏,杨远涛 著,
國際書號(ISBN): 9787118137651
出版社: 国防工业出版社
出版日期: 2025-07-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 301

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
权力意志(全二册。尼采晚年思想结晶;剔除惯性、升华自我的思想利刃)
《 权力意志(全二册。尼采晚年思想结晶;剔除惯性、升华自我的思想利刃) 》

售價:NT$ 500.0
从领口开始编织的钩针毛衫
《 从领口开始编织的钩针毛衫 》

售價:NT$ 301.0
日中之光——埃瓦格里乌斯笔下5—6世纪的拜占庭帝国
《 日中之光——埃瓦格里乌斯笔下5—6世纪的拜占庭帝国 》

售價:NT$ 500.0
唐勾检制研究
《 唐勾检制研究 》

售價:NT$ 296.0
俄罗斯通史(公元9世纪—1917年)
《 俄罗斯通史(公元9世纪—1917年) 》

售價:NT$ 500.0
被争夺的身体:魏玛德国的生育制度
《 被争夺的身体:魏玛德国的生育制度 》

售價:NT$ 449.0
热烈的孤独大宋词人的明月与江湖 大宋顶流小传两宋词人柳永苏轼等两宋王朝史
《 热烈的孤独大宋词人的明月与江湖 大宋顶流小传两宋词人柳永苏轼等两宋王朝史 》

售價:NT$ 356.0
抗衰营养全书
《 抗衰营养全书 》

售價:NT$ 398.0

編輯推薦:
专业体系完整:从基础理论到前沿算法,构建多智能体分层强化学习指挥决策完整知识体系,为想深入智能指挥领域的读者,提供从原理到实践的清晰路径,解决 “知识零散难落地” 痛点 。
聚焦实际难题:直面智能指挥决策中不确定条件、高维空间等现实挑战,用分层强化学习等方法逐个突破,给工程应用、军事指挥等场景从业者,提供解决复杂决策问题的 “实用工具箱” 。
技术策略前沿:融入多智能体协同、知识驱动训练优化等创新思路,紧跟强化学习发展趋势,让关注技术前沿的读者,接触到智能指挥决策最新研究方向与实践方案 。
验证体系扎实:通过多个附录的实验验证,从集中式到分散式决策,从方法到模型优化,用真实数据和场景证明有效性,给注重 “理论可落地” 的读者,吃下技术实用性的 “定心丸” 。
跨领域适配性:既覆盖智能指挥决策理论,又延伸到多智能体强化学习算法、模型训练等技术,适合军事、人工智能、自动化等多领域读者,打破 “领域壁垒”,满足跨学科学习需求 。
內容簡介:
本书针对智能指挥决策里不完全信息、复杂高维空间等问题,从多智能体强化学习和分层决策角度,介绍基于多智能体分层强化学习的指挥决策方法,围绕不确定条件下分层序贯决策建模等 4 个关键问题,讲解相关方法技术 。
目錄
目录
第 1 章 概述
1.1 本书研究背景及目的
1.1.1 研究背景
1.1.2 研究目的与意义
1.2 智能指挥决策及其技术发展现状
1.2.1 智能指挥决策研究现状
1.2.2 强化学习研究现状
1.2.3 多智能体研究现状
1.2.4 智能决策算法研究现状
1.2.5 发展现状评述
1.3 本书整体内容框架
1.3.1 主要内容
1.3.2 组织结构

第 2 章 智能指挥决策基本理论
2.1 指挥决策
2.1.1 指挥决策基本概念
2.1.2 指挥决策面临的挑战
2.2 智能指挥决策
2.2.1 智能指挥决策基本内涵
2.2.2 智能指挥决策中的 Agent
2.2.3 智能指挥决策的优势
2.2.4 智能指挥决策面临的现实问题

第 3 章 基于多智能体指挥决策的技术策略与总体框架
3.1 智能指挥决策方法选择
3.1.1 指挥决策建模方法
3.1.2 策略求解表征方法
3.1.3 样本数据获取方法
3.1.4 多智能体协同方法
3.2 基于多智能体分层强化学习的指挥决策框架
3.2.1 技术思路
3.2.2 框架设计
3.2.3 实现过程
3.3 需要解决的技术问题
3.3.1 不确定条件下的分层序贯决策建模与求解
3.3.2 高维状态动作空间下的策略搜索效率问题
3.3.3 大规模作战背景下多异构实体协同博弈问题
3.3.4 复杂策略空间下决策模型训练效率问题

第 4 章 基于多 Agent 的指挥决策模型构建与求解
4.1 问题提出及解决思路
4.1.1 问题提出
4.1.2 解决思路
4.2 基于多 Agent 的指挥决策实体建模
4.2.1 基于作战节点 Agent 的指挥决策实体抽象
4.2.2 多 Agent 指挥决策实体层级架构
4.3 基于 MDP 的指挥决策行为建模
4.3.1 完全信息条件下的指挥决策行为模型构建
4.3.2 非完全信息条件下的指挥决策行为模型构建
4.3.3 面向分层决策的指挥决策行为模型构建
4.4 基于 MARL 的指挥决策求解方法建模
4.4.1 多智能体指挥决策过程建模
4.4.2 多智能体指挥决策目标函数

第 5 章 基于分层表征的多智能体集中式指挥决策
5.1 问题提出及解决思路
5.1.1 问题提出
5.1.2 解决思路
5.2 多智能体集中式指挥决策方法
5.2.1 集中式指挥决策总体策略
5.2.2 基于分层表征的空间消减
5.2.3 基于最大熵的随机策略梯度求解
5.3 集中式指挥决策算法实现
5.3.1 基于 DSPG-ME 的多智能体强化学习
5.3.2 DSPG-ME 网络结构设计
5.3.3 神经网络训练

第 6 章 基于信息交互的多智能体分散式指挥决策
6.1 问题提出及解决思路
6.1.1 问题提出
6.1.2 解决思路
6.2 多智能体分散式指挥决策方法
6.2.1 分散式指挥决策总体策略
6.2.2 基于图注意力网络的信息协同
6.2.3 基于价值函数分解的策略协同
6.3 分散式指挥决策算法实现
6.3.1 基于 MAAC-GA 的多智能体强化学习
6.3.2 MAAC-GA 网络架构设计
6.3.3 神经网络训练

第 7 章 基于知识驱动的智能决策模型训练优化
7.1 问题提出及解决思路
7.1.1 问题提出
7.1.2 解决思路
7.2 模型优化总体策略
7.3 知识导向的奖励函数塑形
7.3.1 奖励函数塑形基本原理
7.3.2 基于历史知识统计量的奖励函数离线优化
7.3.3 基于对抗过程经验的奖励函数在线优化
7.4 知识重构的策略初始优化
7.4.1 基于模仿学习的策略生成
7.4.2 面向经验知识的模仿学习
7.4.3 面向教训知识的模仿学习
7.5 虚拟自博弈的联盟训练
7.5.1 基于策略集的对手池构建
7.5.2 基于虚拟自博弈的对手选择
7.5.3 基于对手池的联盟训练

附录 A 集中式指挥决策方法验证
A.1 实验环境与参数设置
A.1.1 实验环境
A.1.2 仿真参数设置
A.2 实验结果与分析

附录 B 分散式指挥决策方法验证
B.1 实验环境与参数设置
B.1.1 实验环境
B.1.2 参数设置
B.2 实验结果与分析

附录 C 知识驱动模型优化方法验证
C.1 实验环境与参数设置
C.1.1 实验环境
C.1.2 参数设置
C.2 实验结果与分析

附录 D “知识 学习 分层” 指挥决策方法验证
D.1 实验设计
D.1.1 合成营山岳丛林遭遇战斗仿真想定描述
D.1.2 仿真环境介绍
D.1.3 实验方案
D.2 智能决策框架与模型实现
D.2.1 战术级智能决策仿真验证框架
D.2.2 战术级智能决策模型实现
D.3 效果分析
D.3.1 方法性能对比分析
D.3.2 模型稳定性对比分析
D.3.3 学习训练效率对比分析
D.4 本章小结

参考文献

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2025 (香港)大書城有限公司 All Rights Reserved.