DOI QR코드

DOI QR Code

Optimal deployment of sonobuoy for unmanned aerial vehicles using reinforcement learning considering the target movement

표적의 이동을 고려한 강화학습 기반 무인항공기의 소노부이 최적 배치

  • 배근영 (창원대학교 정보통신공학과) ;
  • 강주환 (국방기술품질원) ;
  • 홍정표 (창원대학교 정보통신공학과)
  • Received : 2024.01.19
  • Accepted : 2024.03.06
  • Published : 2024.03.31

Abstract

Sonobuoys are disposable devices that utilize sound waves for information gathering, detecting engine noises, and capturing various acoustic characteristics. They play a crucial role in accurately detecting underwater targets, making them effective detection systems in anti-submarine warfare. Existing sonobuoy deployment methods in multistatic systems often rely on fixed patterns or heuristic-based rules, lacking efficiency in terms of the number of sonobuoys deployed and operational time due to the unpredictable mobility of the underwater targets. Thus, this paper proposes an optimal sonobuoy placement strategy for Unmanned Aerial Vehicles (UAVs) to overcome the limitations of conventional sonobuoy deployment methods. The proposed approach utilizes reinforcement learning in a simulation-based experimental environment that considers the movements of the underwater targets. The Unity ML-Agents framework is employed, and the Proximal Policy Optimization (PPO) algorithm is utilized for UAV learning in a virtual operational environment with real-time interactions. The reward function is designed to consider the number of sonobuoys deployed and the cost associated with sound sources and receivers, enabling effective learning. The proposed reinforcement learning-based deployment strategy compared to the conventional sonobuoy deployment methods in the same experimental environment demonstrates superior performance in terms of detection success rate, deployed sonobuoy count, and operational time.

소노부이는 수중에서 음파를 활용하여 정보 수집을 수행하는 장치로, 엔진 소음이나 다양한 음향 특성을 감지하여 수중 표적을 정확하게 탐지하는 대잠전에 효과적인 탐지체계이다. 다중상태 시스템에서의 기존 소노부이 배치 방식은 고정된 패턴이나 휴리스틱 기반의 규칙에 의존하므로, 예측하기 힘든 수중 표적의 기동으로 인해 소노부이 투하 개수 및 작전 소요 시간 측면에서 효율적인 배치를 보장하지는 못한다. 본 논문에서는 기존 소노부이 배치 방식의 한계를 극복하기 위해, 수중 표적의 이동을 고려한 시뮬레이션 기반의 실험 환경에서 강화학습을 이용한 무인항공기의 소노부이 최적 배치를 제안한다. 제안한 방법은 Unity ML-Agents를 통해 Proximal Policy Optimization(PPO) 알고리즘을 이용하여 가상 작전환경과 실시간 상호작용하며 무인항공기를 학습한다. 소노부이 투하 개수 및 음원 및 수신기 간의 비용을 고려한 보상 함수를 설계하여 효과적인 학습이 가능하게 한다. 동일한 실험 환경에서 강화학습을 적용한 배치 방식과 기존 소노부이 배치 방식을 비교한 결과, 탐지 성공률, 투하된 소노부이 개수, 작전 소요 시간 측면에서 강화학습을 적용한 배치 방식이 가장 우수한 성능을 보였다.

Keywords

Acknowledgement

이 논문은 2024년도 국방기술품질원의 재원으로 방산혁신클러스터의 지원을 받아 수행된 연구 일부임(DCL2020L, 2020년 방산혁신클러스터 방산 소재 부품연구실 사업).

References

  1. K. Iqbal, M. Zhang, S. Piao, and H. Ge, "Evolution of sonobuoy through history & its applications: A survey," Proc. IEEE IBCAST, 543-554 (2020).
  2. C. Gilliam, B. Ristic, D. Angley, S. Suvorova, B. Moran, F. Fletcher, H. Gaetjens, and S. Simakov, "Scheduling of multistatic sonobuoy fields using multi-objective optimization," Proc. IEEE ICASSP, 3206-3210 (2018).
  3. S. Simakov, "Localization in airborne multistatic sonars," IEEE J. Ocean. Eng. 33, 278-288 (2008).
  4. U. G. Kim and E. J. Kim, "The optimal sonobuoy deployment method using ASW tactics of US Navy" (in Korean), Proc. International Smart Navy Conference, 1-3 (2019).
  5. S. Ozols and M. P. Fewell, "On the design of multistatic sonobuoy fields for area search," DSTO-TR-2563, Defence Science and Technology Organisation, Tec. Rep., 2011.
  6. E. J. Yun, Optimal deployment of multi-static sonobuoys in fixed-wing aircraft using genetic algorithm (in Korean), (Master. thesis, Hanyang University, 2022).
  7. J. I. Kim and M. S. Han, "Research on optimal deployment for autonomous aerial vehicles using virtual environment and DDPG algorithm" (in Korean), JKIIECT 22-4, 15, 152-163 (2022).
  8. L. P. Kaelbling, M. L. Littman, and A. W. Moore, "Reinforcement learning: A survey," JAIR. 4, 237-285 (1996).
  9. C. M. Taylor, S. Maskell, A. Narykov, and J. F. Ralph, "Joint optimization of sonar waveform selection and sonobuoy placement," Proc. IEEE SSPD, 1-5 (2023).
  10. C. M. Taylor, S. Maskell, and J. F. Ralph, "Using hybrid multiobjective machine learning to optimise sonobuoy placement patterns," IET Radar, Sonar & Navigation, 17, 374-387 (2023).
  11. J. Schulman, F. Wolski, P. Dhariwal, A. Radford, and O. Klimov, "Proximal policy optimization algorithms," arXiv preprint arXiv:1707.06347 (2017).
  12. A. Avcioglu, A. Bereketli, and O. F. Bay, "Three dimensional volume coverage in multistatic sonar sensor networks," IEEE Access, 10, 123560-123578 (2022).
  13. M. P. Fewell and S. Ozols, "Simple detection-performance analysis of multistatic sonar for anti-submarine warfare," Australian Government Department of Defence, Tech. Rep., 2011.
  14. US Navy, "Department of defense Fiscal Year (FY) 2019 budget estimates", Defense-Wide Justification Book Vol. 3 of 5, Tech. Rep., 2018.