...
首页> 外文期刊>Pomiary Automatyka Kontrola >Optimization of Track-Before-Detect Systems with Decimation for GPGPU
【24h】

Optimization of Track-Before-Detect Systems with Decimation for GPGPU

机译:GPGPU抽取后检测前跟踪系统的优化

获取原文
获取原文并翻译 | 示例
           

摘要

Algorytmy śledzenia przed detekcją umożliwiają śledzenie obiektów w warunkach niskiej wartości SNR (Signal-to-Noise Ratio) jednak są one bardzo złożone obliczeniowo. Wykorzystując GPGPU (programowalny procesor graficzny) możliwa jest implementacja czasu rzeczywistego. Dla zaproponowanego w [1] rozwiązania optymalizacji implementacji algorytmu z decymacją sygnału wyjściowego możliwe jest kilkukrotne skrócenie czasu obliczeń. W artykule przedstawiono I porównano dalsze możliwe rozwiązania optymalizacji z wykorzystaniem platformy programowej Nvidia CUDA dla rekurencyjnego algorytmu Spatio-Temporal Track-Before-Detect. Przestrzeń stanów może być decymowana w celu lepszego wykorzystania szybkiej pamięci współdzielonej dostępnej w GPGPU, podczas gdy dane wejściowe oraz wyjściowe przechowywane są w wolnej pamięci globalnej. Wykorzystując testy numeryczne z wykorzystaniem opracowanego oprogramowania do profilowania kodu źródłowego stwierdzono, że najbardziej wydajnym rozwiązaniem spośród analizowanych jest implementacja z oddzielnymi kernelami przetwarzania dla poszczególnych wektorów ruchu, wykorzystania rejestrów do przechowywania danych przestrzeni stanów w miejsce pamięci współdzielonej oraz pamięci texture cache do buforowania danych wejściowych. W przypadku niewykorzystywania metody decymacji optymalnym jest wykorzystanie oddzielnych kerneli, rejestrów dla przestrzeni stanów I bezpośredniego dostępu do pamięci globalnej dla danych wejściowych.%Tracking systems based on Track-Before-Detect (TBD) scheme support tracking of low-SNR objects even if object signal is hidden in a noise. In this paper proposed method [1] is tested using Spatio-Temporal TBD algorithm with an additional code profiling using Nvidia CUDA computational platform. Different implementations are possible and the best solution for downsampled approach is based on the separate, register based state-space (without Shared Memory) and texture cache for input measurements.
机译:预检测跟踪算法允许在低SNR(信噪比)条件下跟踪对象,但是它们的计算非常复杂。使用GPGPU(可编程图形处理器)可以实现实时。对于[1]中提出的优化解决方案,采用输出信号抽取的算法的实现可以将计算时间减少数倍。本文介绍并比较了使用Nvidia CUDA软件平台进行递归时空时空跟踪检测算法的其他可能的优化解决方案。可以减少状态空间以更好地利用GPGPU中可用的快速共享内存,而输入和输出数据则存储在可用的全局内存中。使用开发的源代码分析软件进行的数值测试发现,在分析的最有效的解决方案是对单独的运动矢量使用单独的处理内核,使用寄存器存储状态空间数据代替共享内存以及使用纹理缓存来缓冲输入数据的实现。在不使用抽取方法的情况下,最好使用单独的内核,用于状态空间的寄存器以及直接访问输入数据的全局存储器。%基于先验后跟踪(TBD)方案的跟踪系统即使在目标信号存在的情况下也支持跟踪低SNR的对象隐藏在噪音中。本文使用Nvidia CUDA计算平台,使用时空TBD算法和附加的代码配置文件,对建议的方法[1]进行了测试。可能有不同的实现方式,下采样方法的最佳解决方案是基于单独的,基于寄存器的状态空间(无共享内存)和用于输入测量的纹理缓存。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号