陸軍智能化作戰(zhàn)大樣本推演技術(shù)研究
發(fā)布時(shí)間:
2023-03-21
隨著作戰(zhàn)研究中對不確定性進(jìn)行仿真模擬要求的不斷提高,計(jì)算機(jī)支持的多分支大樣本模式的作戰(zhàn)推演已成為研究這一問題的主要手段之一,在作戰(zhàn)方案的擬制與評估,作戰(zhàn)理論的創(chuàng)新與發(fā)展中,對抗推演都發(fā)揮著越來越重要的作用。但是,由于應(yīng)用背景、建設(shè)目標(biāo)和服務(wù)對象的不同,支持智能化不確定性的推演系統(tǒng)具有不同于傳統(tǒng)的推演模擬系統(tǒng)的特點(diǎn),系統(tǒng)的建設(shè)也面臨許多新的問題和挑戰(zhàn)。如何設(shè)計(jì)具備智能化的作戰(zhàn)指揮決策能力、深度推演強(qiáng)化學(xué)習(xí)能力的模型與系統(tǒng),實(shí)現(xiàn)對作戰(zhàn)行動(dòng)規(guī)則、指揮決策進(jìn)行學(xué)習(xí)優(yōu)化,能夠提供對抗條件下的方案推演分析和戰(zhàn)法戰(zhàn)術(shù)優(yōu)化分析等功能,實(shí)現(xiàn)通過推演總結(jié)作戰(zhàn)經(jīng)驗(yàn)、探索作戰(zhàn)規(guī)律、啟發(fā)作戰(zhàn)思想的目的,已經(jīng)成為當(dāng)前系統(tǒng)建設(shè)中亟需解決的關(guān)鍵問題。

隨著作戰(zhàn)研究中對不確定性進(jìn)行仿真模擬要求的不斷提高,計(jì)算機(jī)支持的多分支大樣本模式的作戰(zhàn)推演已成為研究這一問題的主要手段之一,在作戰(zhàn)方案的擬制與評估,作戰(zhàn)理論的創(chuàng)新與發(fā)展中,對抗推演都發(fā)揮著越來越重要的作用。但是,由于應(yīng)用背景、建設(shè)目標(biāo)和服務(wù)對象的不同,支持智能化不確定性的推演系統(tǒng)具有不同于傳統(tǒng)的推演模擬系統(tǒng)的特點(diǎn),系統(tǒng)的建設(shè)也面臨許多新的問題和挑戰(zhàn)。如何設(shè)計(jì)具備智能化的作戰(zhàn)指揮決策能力、深度推演強(qiáng)化學(xué)習(xí)能力的模型與系統(tǒng),實(shí)現(xiàn)對作戰(zhàn)行動(dòng)規(guī)則、指揮決策進(jìn)行學(xué)習(xí)優(yōu)化,能夠提供對抗條件下的方案推演分析和戰(zhàn)法戰(zhàn)術(shù)優(yōu)化分析等功能,實(shí)現(xiàn)通過推演總結(jié)作戰(zhàn)經(jīng)驗(yàn)、探索作戰(zhàn)規(guī)律、啟發(fā)作戰(zhàn)思想的目的,已經(jīng)成為當(dāng)前系統(tǒng)建設(shè)中亟需解決的關(guān)鍵問題。
一、陸軍智能化作戰(zhàn)大樣本推演主要關(guān)鍵技術(shù)
本文的邏輯起點(diǎn)是軍事斗爭的不確定性,最終目標(biāo)是通過大樣本的智能化對抗推演盡可能多的覆蓋合理的可能性、減少這種不確定性,獲得一種相對確定的對抗結(jié)果。因此,按照“推演前、推演中、推演后”的邏輯順序組織遞進(jìn)的技術(shù)研究。研究內(nèi)容主要包括:推演分支生成和消減技術(shù)和基于深度學(xué)習(xí)的作戰(zhàn)指揮智能化決策技術(shù)[1]。
(一)推演分支生成和消減技術(shù)
研究對抗不確定性建模方法,突破基于不確定性模型的選項(xiàng)分支動(dòng)態(tài)生成、引入人工干預(yù)控制和引導(dǎo)的分支生成、動(dòng)態(tài)裁剪、合并等技術(shù),實(shí)現(xiàn)對同時(shí)運(yùn)行的推演進(jìn)程數(shù)量的動(dòng)態(tài)控制。
1.不確定性建模方法
不確定性建模方法,是在研究聯(lián)合作戰(zhàn)的不確定性及其描述的基礎(chǔ)上,利用決策相關(guān)理論,依托有限狀態(tài)機(jī)等工具,進(jìn)行不確定性決策建模。同時(shí),軍事對抗過程具有明顯的階段性,每個(gè)階段的起始和終結(jié)具有明顯的時(shí)間、地域、力量、事件標(biāo)識,按照多個(gè)階段進(jìn)行對抗不確定性建模,可以有效降低建模的耦合性和復(fù)雜度。
2.對抗策略模型體系
將每個(gè)階段能夠反映戰(zhàn)場情況和對抗策略的模糊數(shù)以及不確定性影響因子進(jìn)行綜合考慮,采用組件化建模方法構(gòu)建對抗策略模型體系,決策模型內(nèi)部采用有限狀態(tài)機(jī)描述當(dāng)前態(tài)勢、敵方動(dòng)向、力量對比、當(dāng)前戰(zhàn)果、當(dāng)前戰(zhàn)損、當(dāng)前消耗、后備力量、裝備物資補(bǔ)給、決策者偏好、決策者心態(tài)、決策者風(fēng)險(xiǎn)態(tài)度等模糊數(shù),并且進(jìn)行樞紐態(tài)勢、決策點(diǎn)和不確定性影響因子的判定和描述,形成對抗策略模型體系[2]。
3.推演分支動(dòng)態(tài)生成與合并
依托對抗策略模型體系,采用多屬性決策方法,在屬性值為區(qū)間數(shù)的情況下計(jì)算各決策與理想決策(對方負(fù)值最大、己方負(fù)值最小)的接近度并排序,通過算法尋找可以接受的決策路徑集合,即可實(shí)現(xiàn)推演多分支的動(dòng)態(tài)生成[3]。通過對自動(dòng)生成的推演分支進(jìn)行分類顯示,采用樹形結(jié)構(gòu)進(jìn)行多分支管理,允許設(shè)置參數(shù)自動(dòng)選取部分推演分支,對部分決策點(diǎn)取值差別不大,或策略選擇類似的分支進(jìn)行合并,減少無效、低效分支數(shù)量,縮小整體推演規(guī)模,實(shí)現(xiàn)推演分支的裁剪合并和推演資源優(yōu)化。
(二)基于深度學(xué)習(xí)的作戰(zhàn)指揮智能化決策技術(shù)
根據(jù)軍事需求和業(yè)務(wù)需求研究成果,結(jié)合多分支大樣本作戰(zhàn)推演的應(yīng)用需求,針對作戰(zhàn)行動(dòng)、指揮決策模型的優(yōu)化,研究如何采用歷史推演或訓(xùn)練數(shù)據(jù),通過機(jī)器學(xué)習(xí)方法來優(yōu)化作戰(zhàn)行動(dòng)的策略和價(jià)值網(wǎng)絡(luò)。
1.基于戰(zhàn)場態(tài)勢的行動(dòng)集合規(guī)劃技術(shù)
戰(zhàn)場態(tài)勢由每一個(gè)作戰(zhàn)單元的重要程度、所處位置、可以影響的范圍、作戰(zhàn)目的、敵我雙方的危害等變量組成。研究如何根據(jù)當(dāng)前戰(zhàn)場態(tài)勢自動(dòng)規(guī)劃出下一步可以采取的作戰(zhàn)行動(dòng)的集合,以支持作戰(zhàn)行動(dòng)策略和行動(dòng)價(jià)值的學(xué)習(xí)優(yōu)化,以及最優(yōu)作戰(zhàn)行動(dòng)的搜索。
2.基于機(jī)器學(xué)習(xí)的行動(dòng)策略神經(jīng)網(wǎng)絡(luò)
建立深度卷積的作戰(zhàn)行動(dòng)策略網(wǎng)絡(luò),其作用是輸入當(dāng)前戰(zhàn)場空間態(tài)勢的特征參數(shù),輸出下一步作戰(zhàn)行動(dòng)的概率分布。研究戰(zhàn)場空間態(tài)勢的特征描述方法,并使用歷史對抗數(shù)據(jù)對行動(dòng)策略神經(jīng)網(wǎng)絡(luò)進(jìn)行有監(jiān)督學(xué)習(xí)。用作戰(zhàn)行動(dòng)策略網(wǎng)絡(luò)進(jìn)行自我對抗,并記錄作戰(zhàn)推演過程,用于行動(dòng)策略神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)。
3.作戰(zhàn)行動(dòng)的蒙特卡洛樹搜索算法
作戰(zhàn)行動(dòng)蒙特卡洛樹搜索算法,采用作戰(zhàn)行動(dòng)策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)來減小作戰(zhàn)行動(dòng)搜索寬度和深度,模擬作戰(zhàn)指揮人員的指揮經(jīng)驗(yàn)和大局觀,及對作戰(zhàn)行動(dòng)的深思熟慮過程,實(shí)現(xiàn)蒙特卡洛樹搜索過程管理,最終選擇優(yōu)化的作戰(zhàn)行動(dòng)。
二、基于大樣本的智能化作戰(zhàn)推演系統(tǒng)框架結(jié)構(gòu)
針對陸軍智能化作戰(zhàn)大樣本推演應(yīng)用需求,建立自主可控的對抗推演支撐平臺(tái),總體技術(shù)方案如下圖所示:
圖1總體技術(shù)方案示意圖
為滿足方案推演分析和戰(zhàn)法戰(zhàn)術(shù)優(yōu)化分析等應(yīng)用需求,構(gòu)建基于大樣本的陸軍智能化作戰(zhàn)推演支撐平臺(tái)。該平臺(tái)主要包括:國產(chǎn)化仿真引擎、智能對抗策略建模、仿真模型體系、推演多分支生成[4]、仿真運(yùn)行管控、多分支仿真推演運(yùn)行顯示、大樣本推演數(shù)據(jù)分析挖掘、人機(jī)交互界面等功能。
(一)國產(chǎn)化仿真引擎
仿真引擎的作用主要是將仿真域和問題域隔離,為應(yīng)用領(lǐng)域模型提供公共的仿真運(yùn)行支撐服務(wù),包括對象管理、事件管理、時(shí)間管理、通信管理、數(shù)據(jù)分發(fā)管理、顯示與控制等。具備多線程并行離散事件仿真、模塊化柔性仿真服務(wù)、高性能運(yùn)行數(shù)據(jù)采集存儲(chǔ)能力,提供推演步數(shù)控制、中間數(shù)據(jù)保存、推演回退管理等多分支串行推演支撐能力,提供并行狀態(tài)監(jiān)視、推演進(jìn)程管控、動(dòng)態(tài)負(fù)載均衡等多分支并行推演支撐能力[5]。
(二)智能對抗策略建模
在基于計(jì)算機(jī)技術(shù)的軍事仿真推演中,需要對推演場景中的多個(gè)仿真作戰(zhàn)單位或?qū)嶓w的對抗策略建立統(tǒng)一體系的仿真模型,通過這些計(jì)算機(jī)仿真的對抗策略模型,才能規(guī)劃出這些作戰(zhàn)單位或?qū)嶓w的下一步的作戰(zhàn)行動(dòng)和計(jì)劃。由于現(xiàn)代戰(zhàn)場必然存在的戰(zhàn)爭迷霧特性,在進(jìn)行作戰(zhàn)決策時(shí)均存在著大量不確定性因素或突發(fā)事件,往往存在著多個(gè)作戰(zhàn)策略可供選擇,所以應(yīng)該為軍事仿真推演中各個(gè)仿真作戰(zhàn)單位或?qū)嶓w研究建立統(tǒng)一的作戰(zhàn)策略模型體系,進(jìn)行對抗策略環(huán)分析,形成進(jìn)攻方策略集和防御方策略集,實(shí)現(xiàn)基于機(jī)器學(xué)習(xí)的博弈對抗不確定性條件下的智能對抗策略建模。
(三)仿真模型體系
構(gòu)建用于進(jìn)行仿真推演的模型體系,主要包括:實(shí)體模型、行為模型、決策模型、環(huán)境模型。實(shí)體模型主要描述作戰(zhàn)實(shí)體的基本屬性和裝備編配;行為模型將作戰(zhàn)任務(wù)執(zhí)行過程拆解為基本元?jiǎng)幼骱蛷?fù)合動(dòng)作;決策模型主要按照對抗策略建模,分為進(jìn)攻策略和防御策略;環(huán)境模型主要分為地理環(huán)境模型、氣象水文環(huán)境模型和電磁環(huán)境模型。
(四)推演多分支生成與裁剪
基于大數(shù)據(jù)的陸軍智能化作戰(zhàn)推演分支自動(dòng)生成主要由不確定對抗策略下的仿真分支生成技術(shù)和分支想定動(dòng)態(tài)裁剪與合并技術(shù)組成,采用基于大數(shù)據(jù)的非結(jié)構(gòu)化策略空間的存儲(chǔ)方式和智能化識別與分析技術(shù)實(shí)現(xiàn)分支策略智能生成;采用分支裁剪法通過遍歷解空間樹找出滿足約束條件的一個(gè)解,或者是在滿足約束條件的解中找出使目標(biāo)函數(shù)值達(dá)到極大或極小的解,即最優(yōu)解,從而提高算法的解算效率。通過決策點(diǎn)的有限狀態(tài)機(jī)描述,實(shí)現(xiàn)推演多分支的自動(dòng)生成、裁剪和合并,最終形成包含多個(gè)分支的仿真推演想定文件。
(五)仿真運(yùn)行管控
對進(jìn)行多分支仿真推演的國產(chǎn)化仿真引擎進(jìn)行運(yùn)行控制,主要包括:時(shí)間同步控制、數(shù)據(jù)同步控制、運(yùn)行控制管理、干預(yù)指令下達(dá)等功能[6]。采用步進(jìn)式推演方式進(jìn)行多分支并行推演,按照多分支樹的層次決定每一決策點(diǎn)的推進(jìn),對每一步推演保存中間數(shù)據(jù),允許進(jìn)行推演步數(shù)的控制和狀態(tài)回退。依托高性能仿真引擎,采用基于決策點(diǎn)協(xié)同控制的多分支并行推演管理控制,針對多分支的動(dòng)態(tài)性,采用決策點(diǎn)控制的方法,制約重復(fù)分支,減少仿真所需遍歷的分支路徑,將一次仿真一條路徑的方式轉(zhuǎn)變?yōu)槎嗦窂讲⑿蟹抡娴哪J剑瑥亩岣叨喾种Х抡嫱蒲菪省?br />
(六)仿真推演運(yùn)行顯示
提供多分支仿真推演運(yùn)行的可視化顯示功能,清晰有效地傳達(dá)與溝通信息,能夠進(jìn)行推演態(tài)勢的二維顯示、三維顯示、顯示元素控制和推演過程的回放,方便進(jìn)行多分支仿真推演的實(shí)時(shí)過程顯示和事后分析評估。主要應(yīng)用于海量數(shù)據(jù)關(guān)聯(lián)分析,對推演中所涉及到的分散信息和異構(gòu)數(shù)據(jù),借助功能強(qiáng)大的可視化數(shù)據(jù)分析平臺(tái),可輔助人工操作將數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,并做出完整的分析圖表,簡單明了、清晰直觀,更易于接受。
(七)大樣本推演數(shù)據(jù)分析挖掘
提供開放式的大樣本推演數(shù)據(jù)可視化分析挖掘工具,能夠自定義分析評估所用的指標(biāo)體系、評估指標(biāo)、評估算子,由評估算子以可視化方式組合成評估指標(biāo)的計(jì)算流程,由評估指標(biāo)以可視化的方式組合成評估指標(biāo)體系,能夠集成統(tǒng)計(jì)分析、分類分析、聚類分析、因果分析、對比分析、敏感因子分析、規(guī)律定式分析等算法,便于分析評估人員直接使用。
(八)人機(jī)交互界面
提供友好的人機(jī)交互界面,面向方案推演分析和戰(zhàn)法戰(zhàn)術(shù)優(yōu)化分析等不同應(yīng)用,整合功能界面,優(yōu)化使用流程,提升操作體驗(yàn)。
三、結(jié)束語
本文所研究的陸軍智能化作戰(zhàn)大樣本推演相關(guān)技術(shù),主要針對對抗不確定性帶來的作戰(zhàn)指揮智能化決策作戰(zhàn)推演需求,其成果可用于支撐自主可控的陸軍智能對抗推演支撐平臺(tái)研制,能夠演示對抗條件下的方案推演分析和戰(zhàn)法戰(zhàn)術(shù)優(yōu)化分析等應(yīng)用模式,能夠?yàn)殛P(guān)鍵技術(shù)攻關(guān)、提高技術(shù)成熟度等級和創(chuàng)新聯(lián)合作戰(zhàn)理論等提供支撐;能夠?yàn)檠b備立項(xiàng)決策和研制轉(zhuǎn)階段決策提供支撐,對作戰(zhàn)方案中各個(gè)作戰(zhàn)階段的作戰(zhàn)部署和作戰(zhàn)行動(dòng)所造成的狀態(tài)進(jìn)行演練分析,驗(yàn)證聯(lián)合作戰(zhàn)方案的可行性,優(yōu)化完善作戰(zhàn)方案;能夠?yàn)橹笓]人員認(rèn)知作戰(zhàn)行動(dòng)過程提供支撐,給戰(zhàn)法戰(zhàn)術(shù)研究提供“準(zhǔn)實(shí)踐”環(huán)境。
文章轉(zhuǎn)載自:國防科技
作者:華如科技王軍陳銳湯磊
參考文獻(xiàn)
[1]林健,楊新華.并行離散事件仿真框架研究[J].系統(tǒng)仿真學(xué)報(bào),2001,3,13(2).
[2]Efrem G.Malalch.決策支持與數(shù)據(jù)倉庫系統(tǒng)[M].李昭智,李昭勇,譯.北京:電子工業(yè)出版社,2001.
[3]Chen Y N,Tsai W T.Service-oriented computing and web softwareintegration[M].5th ed.Kendall Hunt Publishing,2015.
[4]Fujimoto R M.Research challenges in parallel and distributedsimulation[J].ACM Transaction on Modeling and computer Simulation,2016,26(4).
[5]喬海泉.仿真引擎與相關(guān)技術(shù)研究[D].北京:國防科學(xué)技術(shù)大學(xué),2007.
[6]王學(xué)慧,張磊.并行離散仿真中的時(shí)間機(jī)制研究[J].IFITA,2009:209-214.
相關(guān)資訊