| | 企业邮箱| EN
子品牌网站
华如防务华如数据鼎成智造

登录

  • 图形验证码

用户密码登录

注册

  • 图形验证码

注册

您已注册成功!

建设中,敬请期待!

技术解读 | 陆军智能化作战大样本推演技术研究

发布时间:2020-04-23 来源:华如科技

摘要:针对复杂作战背景下不确定性带来的作战推演技术难题,面向方案推演分析和战法战术优化分析等实际应用需求,以不确定性、深度学习、数据挖掘等相关理论为基础,重点从推演分支生成、作战指挥智能化决策、推演数据可视化分析等方面进行研究,为陆军基于智能对抗推演理论和技术进行联合作战概念分析、武器装备论证实验、作战方案推演分析、战法战术优化分析提供支撑。

关键词:智能化;大样本;作战推演

随着作战研究中对不确定性进行仿真模拟要求的不断提高,计算机支持的多分支大样本模式的作战推演已成为研究这一问题的主要手段之一,在作战方案的拟制与评估,作战理论的创新与发展中,对抗推演都发挥着越来越重要的作用。但是,由于应用背景、建设目标和服务对象的不同,支持智能化不确定性的推演系统具有不同于传统的推演模拟系统的特点,系统的建设也面临许多新的问题和挑战。如何设计具备智能化的作战指挥决策能力、深度推演强化学习能力的模型与系统,实现对作战行动规则、指挥决策进行学习优化,能够提供对抗条件下的方案推演分析和战法战术优化分析等功能,实现通过推演总结作战经验、探索作战规律、启发作战思想的目的,已经成为当前系统建设中亟需解决的关键问题。

一、陆军智能化作战大样本推演主要关键技术
本文的逻辑起点是军事斗争的不确定性,最终目标是通过大样本的智能化对抗推演尽可能多的覆盖合理的可能性、减少这种不确定性,获得一种相对确定的对抗结果。因此,按照“推演前、推演中、推演后”的逻辑顺序组织递进的技术研究。研究内容主要包括:推演分支生成和消减技术和基于深度学习的作战指挥智能化决策技术[1]。

(一)推演分支生成和消减技术
研究对抗不确定性建模方法,突破基于不确定性模型的选项分支动态生成、引入人工干预控制和引导的分支生成、动态裁剪、合并等技术,实现对同时运行的推演进程数量的动态控制。

1.不确定性建模方法
不确定性建模方法,是在研究联合作战的不确定性及其描述的基础上,利用决策相关理论,依托有限状态机等工具,进行不确定性决策建模。同时,军事对抗过程具有明显的阶段性,每个阶段的起始和终结具有明显的时间、地域、力量、事件标识,按照多个阶段进行对抗不确定性建模,可以有效降低建模的耦合性和复杂度。

2.对抗策略模型体系
将每个阶段能够反映战场情况和对抗策略的模糊数以及不确定性影响因子进行综合考虑,采用组件化建模方法构建对抗策略模型体系,决策模型内部采用有限状态机描述当前态势、敌方动向、力量对比、当前战果、当前战损、当前消耗、后备力量、装备物资补给、决策者偏好、决策者心态、决策者风险态度等模糊数,并且进行枢纽态势、决策点和不确定性影响因子的判定和描述,形成对抗策略模型体系[2]。

3.推演分支动态生成与合并
依托对抗策略模型体系,采用多属性决策方法,在属性值为区间数的情况下计算各决策与理想决策(对方负值最大、己方负值最小)的接近度并排序,通过算法寻找可以接受的决策路径集合,即可实现推演多分支的动态生成[3]。通过对自动生成的推演分支进行分类显示,采用树形结构进行多分支管理,允许设置参数自动选取部分推演分支,对部分决策点取值差别不大,或策略选择类似的分支进行合并,减少无效、低效分支数量,缩小整体推演规模,实现推演分支的裁剪合并和推演资源优化。

(二)基于深度学习的作战指挥智能化决策技术
根据军事需求和业务需求研究成果,结合多分支大样本作战推演的应用需求,针对作战行动、指挥决策模型的优化,研究如何采用历史推演或训练数据,通过机器学习方法来优化作战行动的策略和价值网络。

1.基于战场态势的行动集合规划技术
战场态势由每一个作战单元的重要程度、所处位置、可以影响的范围、作战目的、敌我双方的危害等变量组成。研究如何根据当前战场态势自动规划出下一步可以采取的作战行动的集合,以支持作战行动策略和行动价值的学习优化,以及最优作战行动的搜索。

2.基于机器学习的行动策略神经网络
建立深度卷积的作战行动策略网络,其作用是输入当前战场空间态势的特征参数,输出下一步作战行动的概率分布。研究战场空间态势的特征描述方法,并使用历史对抗数据对行动策略神经网络进行有监督学习。用作战行动策略网络进行自我对抗,并记录作战推演过程,用于行动策略神经网络的强化学习。

3.作战行动的蒙特卡洛树搜索算法
作战行动蒙特卡洛树搜索算法,采用作战行动策略网络和价值网络来减小作战行动搜索宽度和深度,模拟作战指挥人员的指挥经验和大局观,及对作战行动的深思熟虑过程,实现蒙特卡洛树搜索过程管理,最终选择优化的作战行动。

二、基于大样本的智能化作战推演系统框架结构
针对陆军智能化作战大样本推演应用需求,建立自主可控的对抗推演支撑平台,总体技术方案如下图所示:


图1 总体技术方案示意图

为满足方案推演分析和战法战术优化分析等应用需求,构建基于大样本的陆军智能化作战推演支撑平台。该平台主要包括:国产化仿真引擎、智能对抗策略建模、仿真模型体系、推演多分支生成[4]、仿真运行管控、多分支仿真推演运行显示、大样本推演数据分析挖掘、人机交互界面等功能。

(一)国产化仿真引擎
仿真引擎的作用主要是将仿真域和问题域隔离,为应用领域模型提供公共的仿真运行支撑服务,包括对象管理、事件管理、时间管理、通信管理、数据分发管理、显示与控制等。具备多线程并行离散事件仿真、模块化柔性仿真服务、高性能运行数据采集存储能力,提供推演步数控制、中间数据保存、推演回退管理等多分支串行推演支撑能力,提供并行状态监视、推演进程管控、动态负载均衡等多分支并行推演支撑能力[5]。

(二)智能对抗策略建模
在基于计算机技术的军事仿真推演中,需要对推演场景中的多个仿真作战单位或实体的对抗策略建立统一体系的仿真模型,通过这些计算机仿真的对抗策略模型,才能规划出这些作战单位或实体的下一步的作战行动和计划。由于现代战场必然存在的战争迷雾特性,在进行作战决策时均存在着大量不确定性因素或突发事件,往往存在着多个作战策略可供选择,所以应该为军事仿真推演中各个仿真作战单位或实体研究建立统一的作战策略模型体系,进行对抗策略环分析,形成进攻方策略集和防御方策略集,实现基于机器学习的博弈对抗不确定性条件下的智能对抗策略建模。

(三)仿真模型体系
构建用于进行仿真推演的模型体系,主要包括:实体模型、行为模型、决策模型、环境模型。实体模型主要描述作战实体的基本属性和装备编配;行为模型将作战任务执行过程拆解为基本元动作和复合动作;决策模型主要按照对抗策略建模,分为进攻策略和防御策略;环境模型主要分为地理环境模型、气象水文环境模型和电磁环境模型。

(四)推演多分支生成与裁剪
基于大数据的陆军智能化作战推演分支自动生成主要由不确定对抗策略下的仿真分支生成技术和分支想定动态裁剪与合并技术组成,采用基于大数据的非结构化策略空间的存储方式和智能化识别与分析技术实现分支策略智能生成;采用分支裁剪法通过遍历解空间树找出满足约束条件的一个解,或者是在满足约束条件的解中找出使目标函数值达到极大或极小的解,即最优解,从而提高算法的解算效率。通过决策点的有限状态机描述,实现推演多分支的自动生成、裁剪和合并,最终形成包含多个分支的仿真推演想定文件。

(五)仿真运行管控
对进行多分支仿真推演的国产化仿真引擎进行运行控制,主要包括:时间同步控制、数据同步控制、运行控制管理、干预指令下达等功能[6]。采用步进式推演方式进行多分支并行推演,按照多分支树的层次决定每一决策点的推进,对每一步推演保存中间数据,允许进行推演步数的控制和状态回退。依托高性能仿真引擎,采用基于决策点协同控制的多分支并行推演管理控制,针对多分支的动态性,采用决策点控制的方法,制约重复分支,减少仿真所需遍历的分支路径,将一次仿真一条路径的方式转变为多路径并行仿真的模式,从而提高多分支仿真推演效率。

(六)仿真推演运行显示
提供多分支仿真推演运行的可视化显示功能,清晰有效地传达与沟通信息,能够进行推演态势的二维显示、三维显示、显示元素控制和推演过程的回放,方便进行多分支仿真推演的实时过程显示和事后分析评估。主要应用于海量数据关联分析,对推演中所涉及到的分散信息和异构数据,借助功能强大的可视化数据分析平台,可辅助人工操作将数据进行关联分析,并做出完整的分析图表,简单明了、清晰直观,更易于接受。

(七)大样本推演数据分析挖掘
提供开放式的大样本推演数据可视化分析挖掘工具,能够自定义分析评估所用的指标体系、评估指标、评估算子,由评估算子以可视化方式组合成评估指标的计算流程,由评估指标以可视化的方式组合成评估指标体系,能够集成统计分析、分类分析、聚类分析、因果分析、对比分析、敏感因子分析、规律定式分析等算法,便于分析评估人员直接使用。

(八)人机交互界面
提供友好的人机交互界面,面向方案推演分析和战法战术优化分析等不同应用,整合功能界面,优化使用流程,提升操作体验。

三、结束语
本文所研究的陆军智能化作战大样本推演相关技术,主要针对对抗不确定性带来的作战指挥智能化决策作战推演需求,其成果可用于支撑自主可控的陆军智能对抗推演支撑平台研制,能够演示对抗条件下的方案推演分析和战法战术优化分析等应用模式,能够为关键技术攻关、提高技术成熟度等级和创新联合作战理论等提供支撑;能够为装备立项决策和研制转阶段决策提供支撑,对作战方案中各个作战阶段的作战部署和作战行动所造成的状态进行演练分析,验证联合作战方案的可行性,优化完善作战方案;能够为指挥人员认知作战行动过程提供支撑,给战法战术研究提供“准实践”环境。

文章转载自:国防科技
作者:华如科技  王军  陈锐  汤磊

参考文献
[1] 林健, 杨新华.并行离散事件仿真框架研究[J]. 系统仿真学报, 2001,3,13(2).

[2] Efrem G.Malalch.决策支持与数据仓库系统[M].李昭智,李昭勇,译.北京:电子工业出版社,2001.

[3] Chen Y N,Tsai W T.Service-oriented computing and web softwareintegration[M].5th ed.Kendall Hunt Publishing,2015.

[4] Fujimoto R M. Research challenges in parallel and distributedsimulation[J]. ACM Transaction on Modeling and computer Simulation,2016,26(4).

[5] 乔海泉.仿真引擎与相关技术研究[D].北京:国防科学技术大学,2007.

[6] 王学慧,张磊.并行离散仿真中的时间机制研究[J].IFITA,2009:209-214.