基于决策不确定性的多目标跟踪传感器管理_真空技术_新闻动态

摘要：针对高杂波、电子干扰环境，在量测驱动的多目标滤波框架下提出了一种基于决策不确定性的传感器管理方法。首先，根据部分可观测马尔科夫决策过程的理论，给出了基于Rényi信息增量的传感器管理一般方法。其次，综合考虑决策过程的信息完整性、信息质量、信息的内涵等因素，在量测驱动的自适应滤波框架下，基于目标运动态势评估多目标决策不确定性水平，并选取最大决策不确定性目标。最后，以最大决策不确定性目标的信息增量最大化为准则进行传感器分配方案的求解。仿真实验表明所提方法能够有效抑制电子干扰、杂波对多目标跟踪及传感器分配的影响，与基于威胁的传感器管理方法相比，所提方法的平均最优子模式分配(OSPA)距离及平均计算时长均显著降低，且在高杂波、电子干扰情形下具有较高的可靠性。

关键词：传感器管理；多目标跟踪；战术重要性标绘；量测驱动；部分可观马尔科夫决策过程

随着军事技术的发展，信息化作战逐渐成为现代战争的主要形式，这也为传感器系统的有效使用提出了更高的要求[1]。特别是在区域防空中，要实现对空中来犯目标的有效拦截，及早发现并稳定跟踪是关键。在综合利用多传感器对多目标进行跟踪的过程中，为实现传感器资源的高效利用，需要对传感器接收到的多目标信息做实时评估，保证有限的传感器资源优先分配给更感兴趣的目标[2]。从本质上讲，依据多目标信息进行传感器管理属于多属性决策问题[3]，需要对传感器接收到的信息进行分析、排序、评价和择优，最终决策出更切合实际的传感器管理方案。

目前为止，共有3类基于贝叶斯理论的传感器管理方法，即基于任务的管理方法、基于信息论的管理方法和基于风险的管理方法[1,4]。其中，基于风险的管理方法重点关注由作战决策所造成的潜在损失及其发生的概率，具有良好的实际应用价值，已成为传感器管理领域的研究热点[5-7]。威胁等级作为重要的目标状态信息，经常被用来量化决策风险。文献[1]为了降低空中目标威胁评估结果的不准确性和传感器辐射所带来的潜在损失，提出了一种基于风险的多传感器管理方法。文献[8]提出了一种基于威胁度的传感器管理方法，将目标的威胁度视为与目标状态相关的函数，并对目标威胁度的不确定性进行最小化处理，可应用于目标区域监视与空中交通管制。在此基础上，文献[3]基于随机有限集的多目标滤波器提出一种基于目标威胁度评估的传感器控制策略。然而，上述文献在进行传感器管理决策时均利用目标可观测的运动特性或目标状态滤波信息，决策结果严重依赖于传感器对目标的量测信息，但是仅采用目标可观测的信息却无法完全表征用于决策的主要信息属性，例如传感器对目标量测信息的完整性和信息的质量等。在高杂波、电子对抗等实际战场环境下，一方面，高功率的电子干扰使得传感器对目标的量测质量变差，量测误差变大，甚至会出现目标量测不完整等目标“暂消”现象[9]；另一方面，大量的杂波虚警参与到滤波过程与传感器管理过程，不仅会严重影响滤波器对目标数及多目标状态的估计，还会造成计算效率的急剧下降，严重影响传感器资源分配的合理性和实时性[10]。如何在高杂波、电子对抗等复杂环境下，从获得的众多传感器信息中快速地决策出合理的传感器管理方案，对多目标跟踪系统和传感器决策系统都提出了非常高的要求[11]。

近些年来，基于随机有限集(Random Finite Set,RFS)的理论被广泛应用到多目标跟踪领域[12]，其中具有代表性的是概率假设密度(Probability Hypothesis Density，PHD)等滤波算法，该算法可以避免多目标跟踪中的数据关联问题，同时能够实现对目标的检测与估计[13]。目前，已有许多基于RFS框架的传感器管理策略[3,14-15]，但是这些策略均是在无干扰、低杂波等较为理想的环境下展开的，在高杂波环境下，大量的杂波虚警参与到滤波与传感器管理过程，导致算法效率严重退化，从而影响传感器分配的实时性。并且在PHD滤波器的应用过程中，通常假设新生目标的PHD是先验已知的[16]。而在实际中，新生目标的先验信息一般并不能准确获取。虽然已有文献[17]利用传感器量测信息自适应构建目标出生PHD，但截止到目前，高杂波、电子对抗环境下，结合RFS多目标滤波器进行目标状态评估的传感器决策策略，仍然没有得到系统性的方法研究。

针对上述问题，本文在多目标跟踪背景下提出了一种基于决策不确定性的传感器管理方法。首先，建立了基于部分可观测马尔科夫决策过程(Partially Observable Markov Decision Process，POMDP)的传感器管理模型；其次，利用量测驱动的自适应序贯蒙特卡罗PHD(Sequential Monte Carlo PHD，SMC-PHD)滤波器，通过门控方法对量测的属性进行区分，从而抑制杂波对已有目标跟踪的影响，获得对已有目标的高精度滤波；然后综合考虑用于决策过程的信息完整性(传感器对目标的探测)、信息的质量(传感器对目标的量测精度)、信息的内涵(目标的威胁度)等因素，建立了目标决策不确定性的评估方法，并选取决策不确定性最大的目标为优先跟踪目标；在RFS框架下，基于Rényi信息增量作为传感器分配的评价函数，在信息增量最大化的准则下实现基于目标决策不确定性的传感器管理；最后通过仿真实验从多目标状态估计精度、计算效率、可靠性3个方面验证了本文算法的有效性。

值得指出的是，考虑到JDL(Joint Directors of Labs)模型[8]，基于威胁的传感器管理方法构成了从基于JDL1级的传感器管理迈向JDL2/3级传感器管理的第一步，而基于决策不确定性的传感器管理是JDL2/3级传感器管理的进一步深入。这一转变使得传感器管理更贴近战场的实际需求。

1 基于POMDP的传感器管理模型

传感器以雷达为例，典型的任务场景如图1所示。敌方多个空中目标在远距离支援干扰飞机的掩护下穿越我方防御阵地。我方部署N部传感器对敌空中M个目标进行评估，并将获取的量测信息发送到控制中心，控制中心根据获得的信息制定相应的传感器管理方案，并以此控制各传感器工作[1]。由于传感器量测的不确定性、杂波、远距离支援干扰等，控制中心接收到的信息也是不确定的。因此，本文研究的传感器管理问题本质上是一个不确定信息下的决策问题，可以用POMDP对该问题进行建模[15]。

图1 典型任务场景
Fig.1 Typical task scenario

1.1 传感器量测模型

考虑目标在二维笛卡尔坐标系下的运动，单目标状态向量可表示为分别表示x、y方向的位置、速度。在大功率压制干扰下，由于干信比增大，造成被干扰传感器对目标的量测误差增大、探测概率下降，从而导致较大的跟踪误差，甚至会出现目标暂消现象。针对此问题，本文采用一种新的量测模型，表示为

zk=[rk,βk]T=ξ·h(xk)+Vk

(1)

式中：zk为传感器的量测向量；rk和βk分别为目标相对于传感器的距离和方位角；h(·)为量测矩阵；Vk为零均值高斯噪声，其协方差阵为分别为距离、方位角测量误差的方差，与传感器输出端目标的信噪比(S/N)j有关，可表示为[18]

(2)

(3)

式中：Vc为光速；B为传感器波形带宽；λs为传感器波长；D为传感器孔径直径。电子干扰条件下，传感器输出端信噪比(S/N)j可表示为

(4)

式中：J/S为干扰条件下传感器输入端干信比；RSN为无干扰条件下目标的信噪比。

ξ为传感器的量测系数，是一个随机数：

ξ={0,1}

(5)

且P{ξ=1}=Pd，P{ξ=0}=1-Pd，Pd为传感器对目标的探测概率。通常，探测概率Pd是虚警概率Pfa和传感器输出端目标信噪比(S/N)j的函数，详细计算可见文献[18-19]。

1.2 传感器管理

对目标跟踪而言，通常参与跟踪的传感器越多，跟踪性能越好。但是，在许多特殊的应用场合，由于传感器数量、感知范围、使用寿命、带宽、性能等的限制，以及多传感器在时间和空间上的配准问题，每个时刻仅允许使用一个传感器进行跟踪，然后将跟踪结果发送到控制中心[11]。对于控制中心而言，其传感器选择的决策结果是不确定的，不仅与目标的跟踪性能有关，同时也与控制中心获得的目标信息的完整性、信息的质量以及目标信息的内涵(目标的威胁程度)等有关。在这种情况下，当目标飞抵不同区域时，控制中心需要根据系统对目标的需求实时地选择量测信息完整的、信息质量高的传感器对更感兴趣的目标进行优先跟踪，即最优跟踪传感器选择问题。为此，对每一个传感器分配方案ν∈Uk给定一个相应的评价函数最优的控制准则是使k时刻向后H(H≥1)步的评价函数最大化对应的最优分配序列uk，表示为

(6)

式中：Uk+1:k+H表示向后H步总的分配方案集合。随着传感器、目标数量及H的增大，控制集合Uk+1:k+H的势会呈指数增长，因此为了便于计算，本文基于“近视”(“Myopic”)方案进行传感器选择的研究，且假定每个时刻仅使用一个传感器对所有目标进行跟踪。

为了从整体上评估跟踪系统的性能，本文采用基于多目标整体信息增益的传感器选择方案，即以多目标信息增益最大化作为评价函数。Rényi信息增量通过比较概率密度函数的近似程度来表示当前状态下信息的差异，可用于强调某个局部信息，且对多目标先验、后验概率密度函数的分布没有高斯限制，更具灵活性和普适性[20]。因此，本文采用Rényi信息增量作为评价函数。在RFS框架下，假设k-1时刻多目标的先验概率密度函数和后验概率密度函数分别为pk|k-1(Xk|Z1:k-1)和pk|k(Xk|Z1:k-1,Zk(ν))，则Rényi信息增量可表示为

[pk|k-1(Xk|Z1:k-1)]1-αdXk

(7)

式中：α为调整2个概率密度函数尾部重合程度的参数，0<α<1。α=0.5强调概率密度函数的尾部，可以对2个相似的概率分布达到最佳辨别，尤其是闪烁噪声对概率密度函数造成的拖尾效应[20]。因此在本文中，选用α=0.5。

2 自适应SMC-PHD滤波器

典型的PHD滤波器预测方程和更新方程分别为[13]

Dk|k-1(x)=〈Psfk|k-1(x|·),Dk-1|k-1〉+γk(x)

(8)

Dk|k(x)=(1-Pd,k(x))Dk|k-1(x)+

(9)

式中：Ps为单目标存活概率；fk|k-1(x|·)为单目标状态转移函数；γk(x)为k时刻新生目标RFS的PHD；gk(z|·)为单目标观测似然函数，为单目标探测概率；κk(z)为k时刻杂波RFS的PHD。

在上述PHD滤波器中，量测集Zk是唯一的输入变量，新生目标PHD通常假设是已知的，而在大多数实际问题中该先验信息并不能获取。此时，量测集Zk中与新生目标相关的量测对于已有目标的更新是冗余的[16]。特别是在高杂波、电子对抗环境下，新生目标量测中含有大量的杂波虚警，会严重影响滤波器对目标数及多目标状态的估计，不仅会造成传感器资源的浪费，更会导致滤波算法性能及效率的下降，甚至失效。针对高杂波、电子对抗环境，本文采用自适应的PHD滤波器对不同属性的量测进行区分并独立滤波，以降低新生目标量测及杂波虚警对于已有目标滤波的影响，同时显著提高算法的效率。一般而言，杂波虚警与新生目标量测并不能直接区分，因此本文在最优传感器选择时，仅考虑已有目标，对于新生目标，需要在量测被确认后才考虑最优传感器的分配，从而抑制杂波对传感器管理决策的影响，避免将有限的传感器资源浪费在大量的杂波虚警上。

假设已有目标和新生目标生成的量测是可分的，则Zk可表示为

Zk=Zk,b∪Zk,e∪Γk

(10)

式中：Zk,b、Zk,e和Γk分别表示由新生目标、已有目标和杂波虚警生成的量测RFS。同时，用变量ε来标记已有目标和新生目标的PHD[16]，即

(11)

为了解决PHD滤波方程中的积分运算问题，本文利用SMC-PHD滤波器处理密集杂波环境下的多目标跟踪问题，并基于门控方法实现已有目标和新生目标量测的区分。

2.1 已有目标滤波

在PHD滤波器中，k-1时刻的新生目标PHD和已有目标的PHD组成该时刻全部目标的PHD，假设可用粒子集表示，Nk-1表示k-1时刻近似目标PHD的总粒子数。则在滤波器预测步骤，目标的预测PHD可表示为

(12)

式中：表示Dirac delta函数，对应的粒子和权值为

(13)

n=1,2，…，Nk-1

(14)

式中：为重要性密度函数，且一般取

对于已有目标，其更新的PHD可表示为

(15)

式中：

(16)

得到加权粒子集后，已有目标数可表示为

(17)

对于SMC-PHD滤波器而言，为了缓解粒子退化问题，通常需要重采样步骤消除具有较低更新权值的粒子。重采样的粒子数Nk依据当前估计的目标数和分配给每个目标的粒子数η来确定[16]

(18)

式中：[·]表示取整运算。经过重采样后，可用新的加权粒子集近似表示Dk|k(x,0)。

一般地，粒子权值越低，其所代表的真实目标信息就越少，特别是在高杂波、电子对抗等复杂环境下。重采样时消除较低权值的粒子，可以避免大量与目标信息无关的粒子直接参与滤波过程，提高了滤波器的有效性。尽管可能会损失极少的目标信息，但是在本文采用的自适应PHD滤波框架下，这样的目标信息会在下一次迭代中以新生目标的属性继续出现。因此重采样步骤中，消除较低权值的粒子并不会直接影响目标有效信息的完整性。

2.2 新生目标滤波

对于新生目标PHD，本文采用量测驱动的自适应方法，这意味着目标已经被传感器探测到，即Pd,k=1在此处滤波框架下一直适用于新生目标。假设量测值已知，mk,b为Zk,b中量测的数目，则新生目标可以通过在似然函数非零区域进行状态粒子采样得到[17]

n=1,2，…，Mb

(19)

式中：h-1(·)为h(·)的逆运算；H*为h-1(·)的雅克比矩阵；Mb表示从每个量测采样的粒子数。每一个都被视为一个可能源自新生目标的量测。显然，此时的新生目标中含有大量的杂波虚警。多个潜在目标的PHD在单目标状态空间是可加的，即

(20)

式中：为单目标点集{xk,i}的PHD，可近似表示为

(21)

其中，每个粒子的初始化权值为

(22)

为了较好地初始化新生目标，Mb的值需要依据实际情况选取。当杂波信息未知时，引入平衡因子μ=1/mk,b，(mk,b>0)来平衡杂波量测的影响[15]，其含义是依据可能的新生目标量测数目自适应调整每个量测都源于新生目标的信任度，可以随着mk,b的变化而变化。此时，

当采样和权值分配对Zk,b中所有的量测都处理后，则Dk|k(x,1)的加权粒子集近似可表示为

(23)

式中：表示当前与新生目标对应的粒子总数。

2.3 门控方法

与文献[3]所采用的的标准PHD滤波器相比，上述量测驱动自适应滤波器对已有目标和新生目标独立滤波，由于排除了杂波等无关量测对已有目标更新的影响，可以显著改善已有目标的滤波准确性。同时，独立滤波便于对不同属性的目标量测分配传感器，在最优传感器选择时，仅考虑已有目标，对于含有大量杂波虚警的新生目标，并不在第一时间考虑，从而降低了杂波等对目标跟踪及传感器管理决策的影响。在滤波过程中，由于含有大量杂波虚警的新生目标粒子并未参与到SMC-PHD滤波器的权值更新过程中，而且基于量测的新生目标采样处理具有较低的计算复杂度，从而可以显著提高滤波算法的效率，保证了传感器管理决策的实时性。文献[10]提出了一种基于统计距离的验证窗口以区分新生目标量测与已有目标量测，在此基础上，本文根据新息加权平方和在传感器量测空间Es上定义一个验证区域Ω(z)，其半径为

(24)

式中：为新息加权平方和。假设目标的预测粒子集中间变量集XC和WC分别用于存储和单个候选量测zk,j关联的粒子和对应的权值，用来综合评估每个量测所关联的粒子数目和粒子权值和[16]。定义阈值参数τ和γ，从而确定当前量测的属性。该门控方法的伪代码如表1所示。

表1 门控方法伪代码
Table 1 Pseudo code of gating method

上述过程利用了粒子在空间中的分布信息和相应的权值信息，可以显著提高量测区分的准确性[16]。在滤波初始时刻，所有的量测都被认为源于新生目标。阈值参数τ和γ会对量测属性有一定的影响。较小的τ和γ，可能会将新生目标量测误认为已有目标量测，在这些新生目标量测中可能存在杂波虚警等，从而造成滤波精度与滤波效率下降，甚至传感器资源的严重浪费。较大的τ和γ，可能会导致将已有目标量测误认为新生目标量测，在该时刻最大决策不确定性目标选择时将不会再考虑该目标，进而可能影响最优传感器的方案选择，但是并不会影响算法的有效性。因此，在实际中可以保守地将阈值τ和γ设置为一个相对较大的值。

在上述SMC-PHD滤波过程中，新生目标和已有目标的滤波相互独立，通过门控方法可以尽可能地排除杂波等无关量测参与到已有目标更新过程中，从而显著提高杂波环境下已有目标的滤波准确性及算法的效率。虽然杂波量测也可能会被误用于生成新生目标粒子，但是这样的粒子绝大多数会在下一次的滤波迭代过程中被自然消除，而真实的新生目标会结合最新的量测被验证。因此，本文在最优传感器选择时，仅考虑已有目标，对于新生目标，需要下一次迭代确认后才考虑。这样既提高了对已有目标的跟踪精度，又提高了传感器管理算法的效率，同时可以避免将有限的传感器资源浪费在大量的杂波虚警上。

3 基于目标决策不确定性的传感器管理

对于控制中心而言，传感器分配的决策结果是不确定的，受很多因素的影响，特别是在高杂波、电子对抗等复杂环境下，高功率的电子干扰使得传感器对目标的量测质量变差，量测误差变大，甚至会出现目标量测不完整等目标暂消现象。因此，需要对控制中心接收到的目标信息进行分析、评价和择优，以最大程度的降低监视区域目标信息的不确定性，最终决策出更切合实际的传感器分配方案。本文仅从传感器对目标的探测和跟踪角度出发，选取易于量化且对决策结果最具影响的因素：信息的完整性、信息的质量、信息的内涵等，对决策的不确定性进行描述。信息的完整性表征传感器对目标状态的量测是否完整，杂波、电子干扰等会导致传感器对目标的探测概率下降，甚至出现目标暂消现象，加大了决策的不确定性。信息的质量表示传感器对目标量测的精度，量测精度越高，滤波结果越可信，信息的质量就越高，决策的不确定性就越低。信息的内涵表示传感器对目标的滤波信息中所蕴含的目标的威胁度信息，目标威胁越高，决策不确定性就越高。在本文中，通过将探测概率引入传感器量测方程，用以模拟传感器对目标量测的完整性。同时，选取3种常见的目标运动特性(目标速度、航向及距离)对目标威胁度进行建模。并基于自适应的SMC-PHD滤波器估计多目标状态，分别考虑目标信息的完整性、质量、内涵等因素，依据多目标运动态势快速评估多目标决策不确定性水平，并从中选择出当前时刻最大决策不确定性目标，最终决策得到评价准则最优的传感器分配方案。

3.1 已有目标预测PHD及状态提取

在自适应SMC-PHD滤波器中，k-1时刻新生目标和已有目标的PHD组成该时刻全部目标的PHD。然而此时的新生目标中含有大量的杂波虚警，需要结合k时刻最新的量测信息进行确认和估计。因此，为了抑制杂波虚警对传感器分配决策的影响，在最优传感器选择时，仅考虑k-1时刻的已有目标，暂时不考虑新生目标。

假设k-1时刻的已有目标的后验PHD可由一组带权值的随机样本粒子集表示，表示k-1时刻已有目标的粒子总数。依据SMC-PHD滤波算法，用一组带权值的随机样本粒子集来表示已有目标的预测PHD函数，即

(25)

通常，目标状态集合可以通过加权粒子集利用峰值提取技术得到。常见的方法包括k-means[21]、有限混合模型[22]、CLEAN[23]等。但上述方法大多需要复杂的迭代计算，影响算法的实时性、可靠性。因此本文选择文献[24]中的MEAP(Multiple Expected A Posteriori)方法解决多目标状态提取问题，得到目标状态集合利用该集合生成分配方案所需的量测集合。

3.2 决策不确定性的确立及分配方案的决策

本文分别从信息的完整性(探测概率)、信息的质量(测量精度)、信息的内涵(目标威胁度)3个方面描述控制中心决策的不确定性。不同影响因素的综合评估通常采用线性加权方法[8]，需要根据不同的应用场景对权值进行赋值，环境适应性较差。为了解决线性加权法不能体现各因素间的非线性关系问题，本文基于战术重要性标绘(Tactical Significance Map，TSM)方法[25]，提出了一种改进的TSM(Improved TSM，ITSM)方法，依据提取的各目标预测状态来确定当前时刻各目标的决策不确定性。

假设当前时刻传感器对目标i的探测概率为测量误差方差分别为和目标的状态矢量可表示为其中pi和分别表示目标i的位置矢量和速度矢量。假设我方重要战略防御区域中心的位置为x0=[px,0,py,0]T，则目标与战略防御区域中心的距离为若仅考虑目标的战术重要性(威胁度)时的TSM函数表达式为[25]

(26)

式(26)表明，目标距离防御区域中心越近，则其威胁度越高，反之亦然。其中，σTSM取决于目标的速度和航向。若目标以较高的速度朝向防御区域中心运动，则TSM函数值应该很高；若该目标朝防御区域中心反方向运动，则较高的速度应该对应更低的TSM函数值。因此可将目标速度和航向相互影响的σTSM描述为[25]

(27)

式中：k0和m0为正常数;为目标i的航向角，即目标位置矢量和速度矢量的夹角，

(28)

式中：表示标量积。

综上可得仅考虑目标的战术重要性时TSM函数的最终表达式为[25]

fTSM(xi)=

(29)

对于控制中心而言，仅考虑目标的战术重要性显然无法完全表征用于决策的信息属性。通常，目标可观测的运动特性依赖于传感器对目标的探测概率和测量精度。高杂波、电子对抗等会显著影响传感器对目标量测信息的完整性及信息的质量，这不仅会影响滤波器的精度及效率，也会严重影响传感器管理的决策结果。因此，本文提出了一种综合考虑信息完整性、信息质量以及信息内涵的ITSM方法，表达式为

fITSM(xi)=

(30)

式中：k1、k2为正常数，且k1+k2=1。显然，传感器对目标的探测概率越大，表明信息越完整，目标的决策不确定性就越小；传感器对目标的测量误差方差越大，表明信息质量越差，目标的决策不确定性就越大。

依据式(30)，可在预测多目标状态集合中确定当前时刻最大决策不确定性目标利用目标状态提取过程，提取当前时刻最大决策不确定性目标所对应的粒子集合。在局部状态空间上，目标的粒子集可加权近似最大决策不确定性目标的分布特性[3]。假设最大决策不确定性目标的粒子集为，NT表示最大决策不确定性目标对应的粒子总数。则最大决策不确定性目标的预测PHD可近似表示为

(31)

本文以最大决策不确定性目标的Rényi信息增量作为评价指标，目的是使得最大决策不确定性目标的跟踪性能达到最优，从而降低监视区域内目标的决策不确定性。在本文ITSM函数的计算中，已充分考虑了量测不准确、密集杂波、电子干扰等对决策结果的影响，因此，此处可在检测概率Pd,k(x)=1以及不考虑量测噪声、杂波和电子干扰等理想情况下，对每个目标仅生成一个相应的量测。最大决策不确定性目标的理想量测集可表示为

(32)

在执行传感器分配方案时，按照式(32)所给定的最大决策不确定性目标的理想量测集去对已有目标的预测PHD的粒子集进行更新，则最大决策不确定性目标的更新PHD可近似表示为

(33)

式中：

width=331,height=63,dpi=110

(34)

则以PHD形式表示的Rényi信息增量评价函数可表示为[20]

(35)

进而得到反映传感器分配前后最大决策不确定性目标信息增量的评价函数为[20]

(36)

如前文所述，在本文中选用α=0.5，因此评价函数可改写为

(37)

对每一个传感器分配方案ν∈Uk，利用式(37) 计算评价函数最优的控制准则是使评价函数最大化对应的最优分配方案uk。

3.3 算法流程

在SMC-PHD滤波框架下，本文算法的流程如图2所示。

图2 本文所提算法流程
Fig.2 Algorithm framework proposed in this paper

针对高杂波、电子对抗等实战环境，本文算法兼顾了目标跟踪与传感器管理过程，可以较好地抑制高杂波、电子对抗对多目标跟踪及传感器管理决策的影响。首先，本文采用的自适应SMC-PHD滤波器可以基本排除杂波等无关量测对已有目标滤波的影响，从而显著提高已有目标的滤波准确性，为传感器管理提供准确的目标信息；其次，考虑到电子干扰对目标量测完整性、精度等的影响，本文综合考虑了目标信息的完整性、信息的质量及信息的内涵等因素，最大程度的消除了电子干扰对多目标跟踪及传感器管理决策的影响，保证了算法在电子对抗环境下的可靠性；再次，本文算法在滤波器的更新过程中，由于大量的杂波虚警等不参与滤波器的粒子权值计算过程，因此可以显著提高计算效率，算法具有更好的实时性。最后，本文在最优分配传感器选择时，仅考虑已有目标，对于潜在的新生目标，在下一次迭代中结合最新的量测被验证后才开始考虑，从而在提高计算效率的同时降低了杂波虚警对传感器分配决策的影响。

4 仿真

4.1 仿真场景

为了评估所提出传感器管理算法的性能，本文采用文献[24]中的仿真场景，设定监控区域为半径为2 000 m的圆，防御中心设定为圆心，共设有3部同类型传感器，位置分别为(0,0) m、(-1 000,-500) m、(1 000,-500) m，参数如表2所示。

表2 传感器参数
Table 2 Sensor parameters

T=1 s为传感器采样周期，仿真时长100 s，整个仿真过程中共有10个相同类型的目标在不同的时间分别产生于4个不同区域。目标动态过程采用协调转弯模型，可将单目标状态向量增广为为目标转弯速率，则目标状态方程可表示为

xk=f(ωk-1)xk-1+GWk-1

式中：

f(ω)=

width=634,height=111,dpi=110 为零均值高斯噪声，且cov(Wx)=cov(Wy)=15 m/s，cov(Wω)=π/180 rad/s。真实的目标轨迹如图3所示。

图3 目标运动真实轨迹
Fig.3 Trajectories of true targets

支援干扰机位于(0,2 000) m，参数如表3所示。本文所有仿真均采用MATLAB R2012a，硬件配置为Intel(R) Xeon(R) CPU E5620 @2.4 GHz 2.4 GHz。蒙特卡罗仿真次数为50。在SMC-PHD滤波器的实现过程中，单目标粒子采样数为1 000，并规定最小采样数为600。门控方法中，选择阈值参数τ=100和γ=10-4[16]。目标存活概率Ps=0.99，杂波是一个泊松RFS，且在监控区域内服从均匀分布。设置ITSM函数参数为k0=500，m0=1 250[3]，k1=0.4，k2=0.6。另外，本文采用OSPA(Optimal Sub-Pattern Assignment)距离[24]评估多目标跟踪的性能。其定义为：设多目标状态集合为X={x1,x2,…,xn}，相应的状态估计集合为Y={y1,y2,…,ym}，若n≤m，则OSPA距离定义为

表3 干扰参数
Table 3 Jamming parameters

(38)

式中：为所有{1,2,…,m}的排列构成的集合。如果n>m，则如果n=m=0，则距离阶次p≥1，截断系数c>0。仿真中选取p=1，c=100。

4.2 仿真实验

仿真分别从多目标状态估计精度、计算效率、可靠性3个方面验证本文算法的有效性，同时仿真中设置了几组不同的对比方法。方法0是基于决策不确定性的传感器管理方法，即本文方法。方法1是在本文滤波框架下，仅使用传感器1进行目标跟踪的无传感器管理方法。方法2是在文献[3]方法框架下，基于多目标整体的信息增量作为评价函数的传感器管理方法。方法3是文献[3]提出的基于最大威胁度目标的传感器管理方法。

设置杂波密度λ=0.000 5 m-2，不同方案的仿真结果对比如下。图4为4种方法的多目标状态估计OSPA距离统计对比。在整个仿真过程中，无论干扰是否存在，本文方法的平均OSPA距离都是所有方案中最小的。这是由于本文提出的基于决策不确定性的传感器管理方法采用自适应的SMC-PHD滤波器，降低了杂波对已有目标滤波的影响；同时，本文方法兼顾传感器量测信息的完整性、质量及目标的威胁度，可以对目标信息进行择优，在传感器管理决策时，排除了杂波虚警的干扰，从而有效抑制杂波、电子对抗对多目标跟踪及传感器管理决策的影响。方法1采用无传感器管理的方法，在电子干扰情况下(10～80 s)近乎失效，其平均OSPA距离最大，这也说明了电子干扰对传感器管理决策的严重影响。方法2的跟踪效果整体上要略优于方法3，这与文献[3]中的研究结果也是完全吻合的。同时可以看出，在监视区域仅存在杂波虚警的情形下(85～100 s)，本文方法可以基本消除杂波对多目标跟踪的影响，其他方法由于并未对高杂波进行有效的抑制，对目标数的估计存在较大的误差，导致其平均OSPA远高于本文方法。

图4 不同方法OSPA对比
Fig.4 Comparison of OSPA in different methods

图5为本文方法与方法3方法对目标数估计的对比。在整个仿真过程中，方法3方法总体上对目标数过估计，这是由于方法3方法无法有效抑制杂波虚警，将虚警误判为真实目标，不仅影响真实目标的跟踪精度，而且严重浪费传感器资源。与之相比，本文方法总体上可以做到对目标数的正确估计。一方面是由于本文提出的传感器管理方法兼顾目标的威胁度和传感器信息的完整性、质量等，可以对目标信息进行择优，并优先跟踪决策不确定性最大的目标，避免了方法3中目标信息考虑不全面而造成的目标状态估计性能退化的现象；另一方面，本文采用的自适应SMC-PHD滤波器不仅可以避免传统PHD方法对于新生目标先验信息的要求，而且可以较好的抑制杂波对已有目标的影响，显著提高已有目标的跟踪精度。

图5 不同方法目标数评估对比
Fig.5 Comparison of target number estimation in different methods

单次仿真实验时，方法0与方法3的传感器选择分别如图6和图7所示。在电子干扰情形下，由于传感器1处于干扰机的正前方，干扰机对传感器1形成主瓣干扰，因此与方法3相比，本文方法更多选择干扰较弱的传感器2或传感器3。特别是在监视区域内无真实目标的情况下(85～ 100 s)，本文方法可以较好地识别杂波虚警，避免将有限的传感器资源浪费在杂波虚警上，同时可以在整体上获得较低的平均OSPA距离。

图6 方法0传感器选择
Fig.6 Sensor selection result of method 0

图7 方法3传感器选择
Fig.7 Sensor selection result of method 3

图8为本文方法与方法1、方法3在计算效率上的对比。由于方法1并未采用传感器管理，因此其计算效率最高。在无干扰情形下，本文方法的计算效率与方法1基本相当，这说明本文的传感器管理算法并未造成过多的计算负担。特别地，在整个仿真过程中本文方法的计算效率都明显高于方法3，其平均计算时长降低了74.3%，这一方面是由于本文采用的自适应SMC-PHD滤波器仅对已有目标进行更新，而且基于量测的新生目标采样处理具有较低的计算复杂度，可以显著提高滤波算法的效率；另一方面，本文方法在最优传感器的选择时仅考虑已有目标，并未在第一时间考虑含有大量杂波虚警的新生目标，从而显著提高传感器管理的效率。

图8 不同方法计算时长对比
Fig.8 Comparison of calculation time in different methods

算法的可靠性主要通过整个仿真过程中杂波密度和干扰功率对平均OSPA的影响来验证。本文借鉴文献[3]和文献[26]中对于杂波密度的处理方式，分别取杂波密度值为0.000 002 2[3]、0.000 01、0.000 1、0.000 5、0.001、0.005 m-2，并设置2组对比情形。情形1为整个仿真周期0～100 s，情形2为仅考虑电子对抗存在时的仿真时段10～80 s。本文方法与方法3在不同杂波密度不同情形下的平均OSPA对比如图9所示。可以看出，在不同的杂波密度下，本文方法的平均OSPA均低于方法3，在杂波密度较低(0.000 002 2)时，本文方法的平均OSPA略低于方法3，此时影响OSPA 的主要因素是电子干扰，而本文方法不仅可以抑制杂波，还可以抑制电子干扰对多目标跟踪及传感器管理决策的影响。在杂波密度为0.000 5 时，本文方法效果最为明显，平均OSPA相较于方法3显著降低。在高杂波密度(0.005)下，本文方法的平均OSPA甚至低于杂波密度为0.000 1时的方法3方法，从而验证本文算法在高杂波环境下的可靠性。在2组不同的情形下，当杂波密度小于0.000 1时，方法3在情形1下的平均OSPA低于情形2，而当杂波密度大于0.000 1时，正好相反。这是因为对于方法3而言，当杂波密度较低时，对平均OSPA影响较为显著的是电子干扰，当杂波密度较高时，杂波密度对平均OSPA的影响更为显著。而本文方法在整个仿真过程中，2种情形下平均OSPA随杂波密度的增长趋势基本相同，这也证明了本文方法对杂波具有很好的抑制作用，在高杂波环境下具有较高的可靠性。

图9 不同情形下平均OSPA随杂波密度变化的对比
Fig.9 Comparison of average OSPA variation with clutter density in different situations

图10为本文方法与方法3的平均OSPA随干扰功率的变化对比。可以看出在整个干扰功率变化过程中，本文方法的平均OSPA明显小于方法3。在干扰功率小于100 W时，本文方法的平均OSPA基本保持不变，这是由于本文提出的基于决策不确定性的传感器管理方法可以兼顾目标的威胁度和传感器信息的完整性、质量等，可以在电子干扰环境下合理的选择量测信息完整的、信息质量高的传感器对目标进行跟踪，从而最大程度地消除了干扰对目标状态估计的影响。当干扰功率较大时(>100 W)，2种方法的平均OSPA均随着干扰功率的增大而增大，但是与方法3相比，本文方法的增加趋势相对缓慢，平均增长速率约为方法3的74%，这是因为电子干扰具有方向性，同样的干扰功率下，干扰机对不同方向的传感器的干扰效果不同。而本文方法在传感器管理时，需要在多个不同方位的传感器中综合选择信息更完整的、信息质量更高的传感器对目标进行跟踪，可以较为有效的抑制电子干扰对目标跟踪的影响，验证了本文方法在电子干扰环境下的可靠性。

图10 平均OSPA随干扰功率变化的对比
Fig.10 Comparison of average OSPA variation with jamming power

5 结论

本文针对高杂波、电子干扰环境，在自适应SMC-PHD滤波框架下提出了一种基于决策不确定性的传感器管理方法。与基于威胁的传感器管理方法相比，结论如下：

1) 本文方法可以较好地抑制电子干扰、杂波对多目标估计、传感器管理决策的影响，相比于对比方法，其计算效率和跟踪精度明显提升。

2) 在不同杂波密度、干扰功率下，本文方法性能均优于对比方法，从而验证本文算法在高杂波、电子对抗环境下的可靠性。

本文仅从传感器对目标的探测和跟踪角度出发，对传感器决策的不确定性进行描述。在今后的研究中，可以在传感器管理中考虑更多的影响因素，如射频隐身、数据链时延等。

• 混联码垛机器人的结构设计与位姿误差分析	• 多自由度码垛机器人结构设计及运动学研究
• 使用环形过滤器的K 值自适应KNN算法	• 基于流体流动参数检测的过滤器滤网分析∗
• 钛合金过滤器抗冲击性能分析	• 不同工况下Y型网式过滤器流场数值模拟分析
• 阀室316不锈钢引压管穿孔失效原因分析	• 一种硅橡胶绝缘子成品的顶出设备
• 采用螺帽保护套解决紧固件腐蚀问题	• 矿用防爆型真空馈电开关常见故障分析

会员服务

订单服务

基于决策不确定性的多目标跟踪传感器管理

1 基于POMDP的传感器管理模型

1.1 传感器量测模型

1.2 传感器管理

2 自适应SMC-PHD滤波器

2.1 已有目标滤波

2.2 新生目标滤波

2.3 门控方法

3 基于目标决策不确定性的传感器管理

3.1 已有目标预测PHD及状态提取

3.2 决策不确定性的确立及分配方案的决策

3.3 算法流程

4 仿真

4.1 仿真场景

4.2 仿真实验

5 结论

QQ客服

会员服务

订单服务

基于决策不确定性的多目标跟踪传感器管理

1 基于POMDP的传感器管理模型

1.1 传感器量测模型

1.2 传感器管理

2 自适应SMC-PHD滤波器

2.1 已有目标滤波

2.2 新生目标滤波

2.3 门控方法

3 基于目标决策不确定性的传感器管理

3.1 已有目标预测PHD及状态提取

3.2 决策不确定性的确立及分配方案的决策

3.3 算法流程

4 仿 真

4.1 仿真场景

4.2 仿真实验

5 结 论

QQ客服

4 仿真

5 结论