DOI QR코드

DOI QR Code

CNN-based Adaptive K for Improving Positioning Accuracy in W-kNN-based LTE Fingerprint Positioning

  • Received : 2022.07.08
  • Accepted : 2022.08.03
  • Published : 2022.09.15

Abstract

In order to provide a location-based services regardless of indoor or outdoor space, it is important to provide position information of the terminal regardless of location. Among the wireless/mobile communication resources used for this purpose, Long Term Evolution (LTE) signal is a representative infrastructure that can overcome spatial limitations, but the positioning method based on the location of the base station has a disadvantage in that the accuracy is low. Therefore, a fingerprinting technique, which is a pattern recognition technology, has been widely used. The simplest yet widely applied algorithm among Fingerprint positioning technologies is k-Nearest Neighbors (kNN). However, in the kNN algorithm, it is difficult to find the optimal K value with the lowest positioning error for each location to be estimated, so it is generally fixed to an appropriate K value and used. Since the optimal K value cannot be applied to each estimated location, therefore, there is a problem in that the accuracy of the overall estimated location information is lowered. Considering this problem, this paper proposes a technique for adaptively varying the K value by using a Convolutional Neural Network (CNN) model among Artificial Neural Network (ANN) techniques. First, by using the signal information of the measured values obtained in the service area, an image is created according to the Physical Cell Identity (PCI) and Band combination, and an answer label for supervised learning is created. Then, the structure of the CNN is modeled to classify K values through the image information of the measurements. The performance of the proposed technique is verified based on actual data measured in the testbed. As a result, it can be seen that the proposed technique improves the positioning performance compared to using a fixed K value.

Keywords

1. INTRODUCTION

최근 4차 산업혁명시대의 핵심기술인 빅데이터, 사물인터넷, 인공지능 그리고 지능형 로봇 등과 같은 정보통신기술의 급격한 성장세에 따라 시간 및 장소의 제약없이 원활한 네트워크 접속이 가능해지게 되었다. 이에 따라 실내외 구분없이 위치기반서비스 (Location Based Service; LBS)를 지원하기 위해 다양한 융복합기반 측위 시스템 기술이 활발히 연구되고 있으며, 그 응용이 의학, 스포츠, 로봇, 범죄 등으로 매우 폭넓게 활용되고 있다 (Huang et al. 2018, Li et al. 2021). 위치기반서비스는 활용분야에 따라 단말기의 위치정보를 필요로 하며, 위치정보의 정확도 및 가용성은 해당 서비스에 따라 다른 요구사항을 가진다. 특히 112/119 호출에 따른 긴급구조 응급상황에서 요구조자를 구조하기 위해서는 단말기의 위치정보가 필수적이다. 또한 신속한 구조활동을 위해서는 높은 정확도 및 빠른 응답 시간을 갖는 위치정보를 제공해야 한다.

요구조자가 실외에 위치하는 경우 보편적으로 Global Positioning System (GPS)/Global Navigation Satellite System (GNSS) 위성 신호를 기반으로 위치 정보를 추정할 수 있으며, 이는 높은 정확도를 갖는 장점이 있다. 그러나 요구조자가 지하, 터널, 산속, 도심지역과 같은 음영지역에 위치하는 경우 위성신호가 차단되거나 다중경로 신호로 인해 큰 오차를 포함하는 위치정보로 추정하게 된다 (Cheng et al. 2016). 이러한 문제로 인해 다른 인프라 기반의 측위 기술이 연구되고 있으며, 일반적으로 무선통신/이동통신망 기지국에서 송출한 신호 정보를 기반으로 해당 단말기의 위치를 추정하게 된다 (Subedi & Pyun 2020). 이 때 사용할 수 있는 측정 값으로는 Received Signal Strength Indicator (RSSI), Channel Status Information (CSI), Time of Arrival (ToA), Time Difference of Arrival (TDoA), Angle of Arrival (AoA) 등이 있다 (Liu et al. 2010, Pecoraro et al. 2018). 이 중에서 RSSI는 시간 또는 위상 동기화를 위한 특정 하드웨어가 필요하지 않기 때문에 가장 쉽게 접근할 수 있는 정보이다. RSSI 값을 사용하여 삼변측위 (Trilateration), 삼각측위 (Triangulation), Cell-ID, 전자지문법 (Fingerprinting) 등의 방법을 기반으로 단말기의 위치를 추정할 수 있다 (Kolodziej & Hjelm 2006, Vo & De 2016, Rose et al. 2020).

본 연구에서는 LTE 신호의 Reference Signal Received Power (RSRP) 측정치를 사용하여 Fingerprinting 기법을 기반으로 단말기의 위치를 추정하는 것을 목적으로 한다. LTE는 4G 이동통신 기술로 이미 많은 셀룰러용 기지국이 전국망으로 잘 구축되어 있기 때문에 단말기는 음영지역 없이 항상 기지국과 통신이 가능하다는 장점이 있다.

Fingerprinting 기법은 DB를 생성하는 오프라인 단계, 단말기의 위치를 추정하는 온라인 단계로 구성된다. 먼저 오프라인 단계에서는 서비스 영역을 일정한 간격으로 구분하고, 각 기준점에서 획득한 측정치를 사용하여 DB를 구축한다. 각 위치에서는 다수의 신호를 수신하게 되며, 해당 신호를 송출한 기지국의 PCI 번호와 Band 정보도 함께 DB에 저장하도록 한다. 그러나 도심 지역과 같이 넓은 서비스 영역을 대상으로 하는 경우에는 직접 신호를 획득하기에 시간적 비용이 크며, 또한 특정 공간에서는 신호를 획득할 수 없는 경우도 존재한다. 따라서 GNSS와 LTE 신호를 시각동기화 하여 측정 및 저장할 수 있는 장치를 차량에 탑재하고 도로상을 이동하면서 RSRP 정보를 획득한다 (Cho & Ji 2019). 그리고 획득된 위치 기반 측정치와 공간보간법을 함께 사용하여 기준점의 신호정보를 추정한다. 즉, 기준점 사이의 공간에서 획득가능한 RSRP 정보를 이용하여 해당 기준점상의 신호정보로 변환 후 DB를 구축한다 (Li et al. 2005).

온라인 단계에서 단말기의 위치를 추정하는 Fingerprinting 기반 측위 알고리즘으로는 kNN, Support Vector Machine (SVM), Deep Neural Network (DNN) 방법 등이 있다 (Lin et al. 2014, Ge & Qu 2016, Xia et al. 2017, Sinha & Hwang 2019). 이들 알고리즘은 데이터 특정 분류에 속할 확률을 학습 및 예측하는 기법으로 이 중에서 현재 구현이 간단하면서 많이 사용되고 있는 기술은 kNN이다 (Oh & Kim 2018). 이 기법의 가장 중요한 요소는 위치추정을 위해 사용되는 후보 기준위치의 개수인 K 값을 결정하는 것이다. 추정하고자 하는 위치마다 오차가 가장 낮은 최적의 K 값은 전부 다르게 나타나는데, 이를 각각 적용할 수 없으므로 시행착오를 통해 적절한 K 값으로 고정하는 방법이 일반적으로 사용된다 (Amirisoori et al. 2017). 이에 따라 모든 측위 지점에서 동일한 K 값을 사용하므로 특정 지점에 따라 추정 오차가 최적화되지 못하며, 전체적으로 측위 정확도가 낮아지는 경향을 보이게 된다. 이러한 문제를 해결하기 위해서는 측위 지점마다 최적의 K 값을 적용할 수 있도록 적응적인 모델링을 구성하여, K 값을 가변적으로 선택하는 작업이 필요하다. 따라서 본 논문에서는 Weighted-k Nearest Neighbors (W-kNN) 기반으로 측위를 진행할 시 CNN 모델을 통해 K 값을 적응적으로 선택할 수 있는 시스템을 제안하고자 한다. 이를 위해 먼저 획득된 모든 측정치에 대해 RSRP 이미지를 구축하고, 지도 학습을 갖추기 위한 출력 데이터를 생성한다. 이 때 출력 데이터는 측정치마다 K 값을 변경하면서 W-kNN 기반으로 측위를 수행하고, 이 중 오차가 가장 낮은 K 값을 레이블로 생성하도록 한다. 이 후 생성된 데이터를 기반으로 CNN 모델 학습을 진행하고, 추정 단계에서 출력된 K 값을 이용하여 측위를 진행하도록 한다. 본 연구에서는 고정된 K 값과 적응형 K 값을 사용한 측위 성능을 비교분석하여 제안된 기법의 성능이 우수함을 검증한다.

본 논문의 2장에서는 도심지역에서 LTE 측정치를 사용한 기본적인 Fingerprinting 기법에 대해 설명하고, 3장에서는 본 논문에서 제안하는 CNN 모델 기반 적응형 K 설정 기법을 소개한다. 그리고 4장에서는 실 데이터 기반으로 통해 제안된 기법의 성능을 평가하고, 5장에서 결론을 맺는다.

2. LTE FINGERPRINTING LOCALIZATION

Fingerprinting 기법은 패턴매칭 측위방법으로써, Fig. 1과 같이 크게 2가지 단계로 구성된다. 오프라인 단계에서의 주요 목적은 각 기준점에서 기지국 신호 강도 특성을 나타내는 Fingerprint DB를 구축하는 것이다. 이를 위해 서비스 영역을 일정한 간격으로 구분하고, 각 기준점에서 측정된 신호 정보를 해당 좌표와 함께 리스트로 저장해야 한다. 다수의 기지국으로부터 송출된 신호는 기준점마다 다른 패턴의 신호정보를 획득하게 된다. 온라인 단계의 목적은 이동 단말기의 최종 위치 정보를 획득하는 것이다. 즉, 추정하고자하는 위치에서 측정된 LTE 수신신호강도와 오프라인 단계에서 구축된 DB를 비교하여 가장 유사한 특성을 갖는 기준점을 단말기의 위치로 추정하는 것이다.

f1.gif 이미지
Fig. 1. LTE fingerprinting positioning system in urban area.

이 기법은 서비스 영역에서 신호를 직접 획득하기 때문에 주변 환경 정보를 반영한 실제 신호 값을 저장할 수 있다는 장점이 있다. 또한 별도의 하드웨어 설치나 장비가 필요없이 상용 단말기만으로도 측위가 가능하다. 반면에 이 기법의 단점은 서비스 영역의 규모에 비례하여 많은 사전 처리 작업이 요구된다. 또한 수집된 신호 정보는 주위 환경에 대한 전파 특성을 반영하고 있기 때문에 구조물의 변경이 발생할 때마다 DB를 새로 구축해야 한다.

2.1 Offline Database Generation Phase

실내와 같이 서비스 영역이 좁은 경우에는 기준위치 상에서 측정치를 직접 획득하여 DB를 구축할 수 있다. 그러나 도심지역과 같이 서비스 영역이 넓은 경우에는 신호 획득을 위한 기준점의 간격이 클 수밖에 없다. 이로인해 직접 획득을 위한 시간적 비용이 커지게 된다. 또한 어떤 특정 공간에서는 신호 획득이 불가능한 경우가 존재할 수도 있다. 따라서 이 경우에는 공간보간법을 활용하여 DB를 구축하도록 한다. 먼저 Fig. 1과 같이 LTE 신호를 측정 및 저장할 수 있는 신호획득장비를 차량에 탑재하고 도로상에서 위치기반 RSRP 정보를 수집한다. 그리고 수집된 RSRP 정보와 보간법을 함께 사용하여 기준점의 신호정보를 추정하도록 한다. 이 때 추정하는 방법은 Inverse Distance Weighting 기반의 kNN 기법을 사용한다. 이 기법은 기준점 인근에 위치하는 측정치들의 거리에 대한 가중합을 통해 해당 기준점에서의 신호 정보 생성하는 방법으로 Eq. (1)과 같다 (Ismail et al. 2016).

\(\hat{S} (x_R,y_R )=\sum\limits_{i=1}^n \lambda_i S(x_i,y_i )\)                                                                            (1)

여기서 \(\hat{S} (x_R,y_R )\)는 기준점 \((x_R,y_R )\)에서 추정된 신호 값이며, \(S(x_i,y_i )\)는 기준점 인근 위치 \((x_i,y_i )\)에서 측정된 신호 값, \(n\)은 측정치의 수를 나타낸 것이다. 그리고 \(\lambda_i\)\(S(x_i,y_i )\)에 대한 거리 기반 가중치를 나타내며, 모든 가중치들의 합은 1이 되는 특성을 갖는다. 따라서 가중치 \(\lambda_i\)는 Eq. (2)와 같이 기준점과 인근 측정치의 위치 간 거리정보를 역으로 환산하여 계산할 수 있다.

 \(\lambda_i=d_i^{-1} / \sum\limits_{j=1}^n d_j^{-1}\)                                                                                       (2)

여기서 \(d_i\)는 기준점 \((x_R,y_R )\)과 인근 측정치 위치 \((x_i,y_i )\) 간 거리를 나타낸다.

2.2 Online Positioning Phase

측위를 위해 단말기에서 획득된 신호 값은 사전 구축된 DB의 신호정보 간 거리를 계산하여야 하며, 이 과정을 상관 (Correlation)이라 한다. 이를 통해 계산된 거리는 신호 간 유사도를 나타내는 척도이다. 즉, 두 신호 간 거리가 가까우면 유사도는 크고 해당 기준점상의 좌표에 단말기가 위치할 가능성이 크다는 것을 의미한다. 유사도를 측정하기 위한 방법은 Eq. (3)과 같이 Euclidean 거리를 이용한다.

\(D_i={1\over n}\sqrt{ (\sum\limits_{j=1}^n (RSRP_j - RSRP_{ij} )^2 ) } ~~~~~ i=1,2⋯,m\)                                                (3)

여기서 \(RSRP_j\)는 측정된 값 중 \(j\)번째 기지국 신호정보, \(RSRP_{ij}\)는 DB에 저장된 \(i\)번째 기준점에서 \(j\)번째 기지국 신호정보, \(m\)\(n\)은 각각 수신된 기지국과 기준점의 수를 의미한다.

W-kNN 기법은 K개의 후보 기준위치를 선정하는 과정에서는 kNN 기법과 동일하다. 다만 차이점은 신호의 유사도가 큰 기준점에 대해서는 큰 가중치를 부여하고, 유사도가 낮은 기준점에 대해서는 비교적 가중치를 적게 부여한다는 점이다. 이 때 가중치를 계산하는 방법은 Eq. (4)와 같다.

\(\omega_i={N_i \over (D_i+\alpha)}\)                                                                                                  (4)

여기서 \(\omega_i\)\(D_i\)는 각각 \(i\)번째 기준점에서 계산된 가중치와 거리를 나타내고, \(N_i\)는 매칭된 기지국의 수, \(\alpha\)는 신호 값이 동일하여 분모가 0이 되는 문제를 방지하기 위한 작은 상수 값을 의미한다.

Eq. (4)에서 계산된 가중치는 K개의 후보 기준점에 역수로 할당되며, Eq. (5)와 같이 가중합 (Weighted Sum)을 통해 단말기의 위치를 추정하게 된다.

\((\hat{x}, \hat{y} )={\sum\limits_{i=1}^K \omega_i (x_i,y_i ) \over \sum\limits_{i=1}^K \omega_i }\)                                                                                          (5)

W-kNN 기법은 구현이 가장 간단하면서, 응용 분야에 적용하기도 쉬워 현재 Fingerprinting 기반 측위 알고리즘으로 많이 사용되고 있다. 그러나 이 기법은 추정할 위치마다 측위 오차가 가장 낮은 최적의 K 값을 찾기란 어려움이 존재하기 때문에 시행착오를 통해 적절한 K 값으로 결정하는 방법이 일반적으로 사용된다. 이로 인해 추정할 위치마다 최적의 K 값을 적용하지 못하므로 전체적으로 측위 정확도가 낮아지는 문제가 발생하게 된다. 따라서 이 문제를 해결하기 위해 본 논문에서 제안하는 시스템을 3장에서 소개하고자 한다.

3. CNN-BASED ADAPTIVE K

이 장에서는 먼저 제안된 시스템의 전체적인 아키텍처를 소개한 다음 시스템의 각 부분을 개별적으로 설명한다. 이 시스템은 입력과 출력 데이터에 대한 전처리 과정과 K 값을 적응적으로 설정하기 위한 CNN 모델의 구조를 포함한다.

Fig. 2는 제안하는 시스템에 대한 전체 아키텍처를 나타낸 것이다. 이 시스템은 데이터 수집, 전처리 및 모델 훈련을 포함하는 오프라인 단계와 최종 위치를 추정하기 위한 온라인 단계로 구분된다. 오프라인 단계에서는 차량을 통해 수집된 측정치와 보간법을 적용하여 DB를 구축한다. 그런 다음 전처리를 통해 입력 데이터와 출력 데이터를 생성한다. 입력 데이터는 CNN 모델을 훈련하는 데 사용되며, 출력 데이터는 지도 학습을 갖추기 위한 레이블로 사용된다. 온라인 단계에서는 새로운 RSRP 값이 측정되면 입력 데이터의 형태로 전처리를 수행한 다음 CNN 모델에 공급하게 된다. 이에 따라 모델 출력에서 K 값이 결정되며, 분류된 정보를 W-kNN 알고리즘의 파라미터 값으로 사용하여 단말기의 위치를 추정하도록 한다.

f2.gif 이미지
Fig. 2. System architecture of CNN-based variable K setting algorithm.

3.1 Preprocessing of Input Data

측정치 세트의 RSRP에 대한 정규화와 RSRP 이미지를 생성하는 과정을 설명한다. RSRP를 정규화하는 과정은 신경망 모델의 학습 능력을 높이는 데 유용하다. 차량을 통해 연속적인 RSRP 값을 측정하였으며, 이에 대한 RSRP 레이블을 Fig. 3에서 나타내었다. 여기서 \(k\)는 획득된 측정치의 총 수, \(n\)은 RSRP를 수신한 기지국의 측정 수이다. RSRP 레이블에 대한 정규화는 Eq. (6)과 같이 Min-Max normalization을 통해 이루어진다.

\(RSRP_{k-(n)}^\prime={RSRP_{k-(n)}-(RSRP)_{min} \over (RSRP)_{max}-(RSRP)_{min} }\)                                                                    (6)

여기서 \(RSRP_{k-(n)}\)\(RSRP_{k-(n)}^\prime\)은 각각 \(k\)번째 측정치에서 \(n\)번째 기지국에 대한 RSRP와 변환된 RSRP를 나타내며, \((RSRP)_{max}\)\((RSRP)_{min}\)은 각각 RSRP 레이블에서의 최대값과 최소값을 의미한다. 이를 통해 정규화된 RSRP 레이블은 모두 0에서 1 사이의 값으로 변환되며, 0은 약한 신호 또는 Null 신호, 1은 가장 강한 신호를 나타낸다.

f3.gif 이미지
Fig. 3. RSRP label of acquired meaurements.

딥러닝에서 가장 중요한 요소는 학습에 사용할 수 있는 데이터의 양이 많아야 한다. 또한 데이터는 Gradient 기반 학습을 진행할 때 학습 과정을 가속화하고 알고리즘 발산의 위험을 최소화하기 위해 정규화되는 과정이 필요하다 (Njima et al. 2019).

정규화된 RSRP 값을 이용하여 학습 모델에 공급되는 이미지를 생성하도록 한다. 도심지역과 같이 넓은 서비스 영역에서는 RSRP 값이 다수의 기지국에서 측정된다. 즉, 기지국의 수신 커버리지에 따라 해당 RSRP 값이 측정되며, 이 때 송출된 기지국의 고유번호인 PCI 와 Band 정보를 함께 저장한다. Fig. 4는 입력 데이터를 생성하기 위한 이미지의 구조를 나타낸 것이다. 여기서 \(N\)\(M\)은 각각 가로와 세로 방향의 이미지 픽셀 수, \(K\)는 측정치의 전체 수를 의미한다. 그리고 \(R_{NM}\)은 각 픽셀에 대한 RSRP 값을 나타내며, 기지국의 PCI와 Band 정보에 따라 픽셀의 위치를 구분하고, 송출한 기지국의 정보에 따라 해당 픽셀에 RSRP 값을 입력하도록 한다. 이를 통해 \(N×M\)은 측위 영역에서 송출된 모든 기지국 정보의 수가 되며, Null 신호에 대해서는 0으로 입력하도록 한다.

f4.gif 이미지
Fig. 4. The structure of the RSRP image.

3.2 Preprocessing of Output Data

정답 정보의 레이블인 출력 데이터를 생성하는 과정을 설명한다. 지도 학습은 정답 정보의 레이블이 있는 입력 데이터를 모델에 투입하면 학습 모델이 입력 데이터와 정답 사이의 관계를 찾아내는 기계학습 (Machine Learning) 알고리즘이다. 따라서 새로운 데이터를 입력했을 때 모델이 파악한 관계식을 적용하여 결과를 예측할 수 있다. 따라서 지도 학습을 갖추기 위해서는 각각의 입력에 대해 레이블을 달아놓은 데이터 필요하다. 이를 위해 먼저 DB와 측정치를 이용하여 W-kNN 기반으로 측위를 진행한다. 이 때 고정된 K 값의 설정 범위에 따라 반복 측위를 수행한다. 즉, 만약 K의 값을 1부터 10까지로 설정하였다면 K 값에 따라 총 10번의 측위가 이루어진다. 이를 통해 설정된 범위에 따른 측위 오차가 각각 계산되며, 이 중 오차가 가장 낮은 K의 값을 정답 데이터로 저장한다. 이 과정을 모든 측정치에 대하여 진행하고, 각 측정치마다 저장된 정답 값을 전부 병합하여 레이블을 생성한다. 이를 통해 생성된 출력 데이터는 Fig. 5와 같이 해당 입력 데이터에 각각 대응된다. 학습 모델의 출력에서 분류될 개수는 K 값의 설정 범위와 동일해야 한다. 즉, 출력 데이터를 생성하기 위해 설정한 K 값의 개수에 따라 모델 출력 노드의 수는 전부 상이하게 구성될 수 있다.

f5.gif 이미지
Fig. 5. The structure of the output data.

3.3 K Value Determination Model

CNN은 이미지를 분석하기 위한 패턴을 찾는데 유용한 알고리즘이다. 이는 입력 데이터의 노이즈에 대한 복원력이 높으며 복잡한 이미지 분류 작업에 대해 우수한 결과를 제공한다. Fig. 6은 K 값을 결정하기 위한 CNN 모델의 아키텍처를 나타낸 것이다. CNN 구성 단계에는 네트워크 레이어 구성, 하이어파라미터 설정, 그리고 훈련 및 예측을 포함한다. 이 중 네트워크의 히든 레이어 구성 단계에서는 Convolution 레이어, Pooling 레이어, 그리고 Fully Connected 레이어를 설계하도록 한다. 제안된 모델에서는 실제 서비스 영역에서 송출된 기지국의 PCI와 Band 조합의 전체 수에 따라 입력 데이터인 RSRP 이미지의 크기를 \( 36×36\)으로 구성한다. CNN의 히든 레이어는 총 4개의 레이어로 설계하며, 구체적인 구성 방법은 다음과 같다. 먼저 첫 번째 레이어는 32개의 필터와 \( 2×2\) 커널을 갖는 Counvolution과 \( 2×2\)의 Max Polling (stride = 2)을 사용하여 이미지를 생성한다. 그런 다음 두 번째 레이어는 64개의 필터와 \( 2×2\)의 Convolution 커널을 사용하여 \( 2×2\) Max Polling (stride = 2)을 통해 Convolution 연산을 다시 수행한다. 그리고 세 번째 레이어에서는 이전 레이어와 동일한 Convolution 연산이 이루어진다. 이 과정을 통해 이미지의 특징 값들이 추출되며, 마지막 Fully Connected 레이어에 연결하기 위해 2차원인 이미지를 1차원으로 평활화 (Flattened) 한다. 이를 통해 평활화된 특징 값들은 Hidden Fully Connected 레이어에 연결되고, 최종적으로 출력 데이터에서 Softmax 함수를 사용하여 K 값을 분류한다. 모든 레이어에서는 활성화 함수로 Eq. (7)과 같은 ReLU가 사용된다.

\(f(x)=\max(0,x)\)                                                                                    (7)

f6.gif 이미지
Fig. 6. CNN network architecture.

기존 ANN에서 주로 사용하던 활성화 함수는 sigmoid와 tanh가 있다. 그러나 이는 데이터의 복잡도가 높거나 모델의 차원이 높아지게 되면 Gradient vanishing 현상으로 인해 학습이 되지 않는 문제가 발생한다. 그러나 ReLU는 기울기에 대한 미분 값이 멀리있는 레이어까지도 원활히 전달되는 성질이 있어 모델이 아무리 복잡해도 비선형적인 피팅 (fitting)을 수행할 수 있다는 장점이 있다. 훈련 과정에서 오버피팅되는 것을 해결하고, 학습 모델이 간결해지는 것을 방지하기 위해 Dropout을 추가한다. 이 때 Dropout의 크기는 0.5로 설정하고, 세 번째 레이어와 Fully Connected 레이어에만 적용하도록 한다. 그리고 오버피팅을 줄이기 위해 Dropout을 사용하는 것 외에도 조기 종료 방법도 사용한다. 조기 종료 방법은 훈련 중에 검증 Set에 대한 모델의 성능을 계산하는 데 사용된다. 즉, 모델 훈련 과정에서 이전 학습보다 성능 개선이 없거나 낮아지게 되면 오버피팅 되었다고 간주하고 훈련을 중지한다. 따라서 이전 학습 모델이 최종적인 매개변수의 역할을 한다.v Table 1은 모델 훈련을 위해 사용한 하이퍼파라미터를 나타낸 것이다. CNN 모델을 훈련하는 것은 시스템을 구현하는데 시간 소요가 가장 큰 과정이기 때문에 훈련을 가속화하기 위해 미니 배치 네트워크를 사용한다. 이에 따라 epoch에 따른 반복 횟수는 Eq. (8)과 같이 계산할 수 있다.

\(iterations={number~of~training~data \over mini~batch~size}×epochs\)                                                      (8)

CNN 모델의 훈련 과정은 역전파 (Back-propagation)을 사용한다. 가중치와 바이어스는 손실 함수를 줄이기 위해 입력과 출력 사이의 관계에서 반복적으로 업데이트 되었으며, 이 때 최적화로 Adam 방식 (Kingma & Ba 2015)을 사용하였다.

Table 1. Hyperparameters of the CNN model.

Hyperparameters Value
Input size
Number of output neurons
Number of convolutional layers
Number of fully connected layers
kernels size
Max-pooling size
Activation function
Optimizer
Dropout
Learning rate
Batch size
Early stopping patience
36 × 36
14 (According to number of K value)
3
1
2 × 2
2 × 2 (Stride = 2)
ReLU
Adam
0.5
0.001
128
5

 

4. EXPERIMENTAL RESULTS

본 논문에서 제안하는 CNN 모델 기반 적응형 K 설정 시스템을 이용한 W-kNN의 측위 성능 및 유용성을 검증하기 위해 실시험을 수행하였다.

4.1 Experiment Environment

시험을 위한 테스트 장소는 서울특별시 서초구 서초 1, 2동이며, Nemo Handy 소프트웨어가 탑재된 Galaxy 단말기를 사용하여 측정치를 획득하였다. 측정치는 테스트 장소에서 차량을 통해 이동하면서 Fig. 7과 같이 도로상에서만 획득하였다. 기지국으로부터 신호를 수신함으로써 다양한 정보를 획득할 수 있으며, 이 중 GNSS 기반 위치정보와 RSRP 정보, 그리고 해당 기지국의 PCI 번호와 Band 정보를 함께 저장하였다. 이를 통해 획득된 측정치의 수는 총 319,496개이며, 이는 DB를 구축하기 위한 정보로 사용되었다. Fig. 8은 측정치와 공간보간법을 사용하여 구축한 DB에 저장된 기준점의 위치를 나타낸 것이다. 여기서 빨간색 점은 기준점 사이의 공간에 위치하는 측정치를 사용하여 신호정보가 추정된 기준위치를 나타낸 것이며, 파란색 점은 인근 측정치가 없어 추정되지 못한 기준위치를 나타낸 것이다. 본 연구에서 기준점 상의 신호정보를 추정하기 위한 측정치의 활용 범위는 기준점의 간격과 동일한 10 m로 설정하였다.

f7.gif 이미지
Fig. 7. Service area and acquisition location of measurement.

f8.gif 이미지
Fig. 8. Location on the reference points of the fingerprint DB generationed using the measurements.

4.2 Performance Comparision

제안된 시스템의 성능을 평가하기 위해 고정된 K 값을 사용할 때의 측위 결과와 비교분석을 실시하였다. 실험에 사용된 데이터는 Fig. 9와 같이 총 8곳의 측위 영역을 선정하고, 각 영역에서 획득한 측정치를 이용하여 평가를 진행하였다. 이를 이용하여 먼저 W-kNN에서 고정된 K 값에 따른 평균 위치 오차를 각각 계산하였으며, 이는 Fig. 10에서 나타내었다. 그림에서 보는 바와 같이 K 값을 10으로 사용하였을 때의 추정된 평균 위치 오차 값이 최소가 되며, 이 후 K 값이 증가할수록 오히려 오차가 증가하는 것을 확인할 수 있다. Fig. 11은 각 측위 영역에서 W-kNN 기반으로 측위를 진행할 시 K 값을 10으로 고정한 방법과 제안된 시스템을 통해 K 값을 가변적으로 적용하여 측위를 수행한 결과를 각각 나타낸 것이다. 각 그림에서 파란색 점은 테스트 데이터의 참 위치, 빨간색 점은 추정된 위치를 나타낸 것이다. 그리고 Table 2는 측위 영역에서 각 방법에 따라 추정된 위치정보의 오차를 나타낸 것이다. 먼저 추정된 위치를 보면 노이즈가 큰 RSRP 신호의 특성 때문에 추정된 위치 정보가 궤적 상에 정확하게 위치하지 못하는 것을 확인할 수 있다. 또한 각 테스트 데이터마다 수신된 기지국 정보의 수가 각각 상이하기 때문에 만약 해당 데이터에서 수신받은 기지국의 수가 적다면 추정된 위치정보의 오차가 증가할 수 있다. 먼저 고정된 K 값을 사용하여 측위를 진행한 결과를 보면 추정된 위치 정보의 분산이 전체적으로 큰 것을 확인할 수 있다. 또한 고정된 K 값을 사용하기 때문에 일부 위치에서는 오차가 큰 위치 정보로 추정되는 것을 볼 수 있다. kNN에서 가장 중요한 요소는 참 위치 대비 추정된 위치의 오차가 가장 낮은 최적의 K 값을 설정하는 것이다. 측위 영역의 테스트 데이터 위치마다 K 값에 따른 측위 성능은 각각 다르게 나오며, 이 중 위치 오차가 가장 낮게 계산되는 최적의 K 값이 존재한다. 따라서 적절한 K 값으로 결정하더라도, 일부 데이터에서는 오히려 위치 오차가 커질 수 있다는 문제가 발생한다. 이로 인해 추정된 위치마다 최적의 K 값을 사용하지 못하므로 전체적으로 측위 성능이 낮아지게 된다. 반면에 제안된 기법을 통해 K 값을 적응적으로 가변하면서 사용한 결과를 보면 추정된 위치정보의 분산이 상대적으로 낮은 것을 확인할 수 있다. 또한 일부 데이터에서는 고정된 K 값으로 인해 큰 오차를 가지는 위치로 추정되었던 정보가 K 값을 가변적으로 설정함으로써 참 위치 인근으로 추정되는 것을 확인할 수 있다.

f9.gif 이미지
Fig. 9. Test area for positioning.

f10.gif 이미지
Fig. 10. Mean position error according to K value.

f11-1.gif 이미지
f11-2.gif 이미지
Fig. 11. Comparison of positioning results. (left) fixed K (K=10), (right) adaptive K.

Table 2. Summary of evaluation in positioning area.

Positioning
area
Positioning errors according to the K value setting method
Fixed K (K=10) Variable K
Mean (m) Standard deviation (m) Mean (m) Standard deviation (m)
1
2
3
4
5
6
7
8
77.6
46.8
95.1
100.5
89.8
73.1
63.2
62.0
77.6
45.5
84.4
96.3
76.8
66.7
47.2
51.9
68.7
36.1
88.4
90.8
70.2
70.9
47.5
58.0
70.9
40.2
86.8
86.2
72.4
68.0
38.1
50.1
Mean 75.5 72.2 65.3 67.4

 

이는 다음과 같이 정리할 수 있다. 제안된 시스템 은 W-kNN 기반으로 측위를 수행할 시 측정치의 RSRP 이미지를 통해 K 값을 가변적으로 선택하는 알고리즘이다. 즉, 훈련된 CNN 모델에서 각 테스트 데이터마다 최적의 K 값을 출력해주기 때문에, 고정된 K 값으로 측위를 수행할 시 발생하는 문제점을 해결할 수 있다는 장점이 있다. 이로 인해 W-kNN 기반으로 측위를 수행할 시 적절한 K 값으로 직접 설정할 필요가 없으며, 측위 데이터마다 최적의 K 값을 결정해주기 때문에 고정된 K 값을 적용할 때보다 성능이 향삼됨을 확인할 수 있다.

5. CONCLUSIONS

본 논문에서는 도심 지역에서 LTE의 RSRP 측정치를 사용하여 Fingerprinting 기법을 기반으로 측위를 진행하는 과정에 대해 설명하였다. 이 때 측위 알고리즘으로는 W-kNN 방법을 사용하였다. kNN 기반 알고리즘을 사용하기 위해서는 이웃 수인 K의 값을 설정하여야 한다. 그러나 이 방법은 고정된 K 값을 사용하기 때문에 추정 위치마다 최적의 K 값을 적용할 수가 없다. 이로 인해 전체적으로 추정된 위치정보의 정확도가 낮은 특성을 보이게 된다. 이 문제를 해결하기 위해 본 연구에서는 W-kNN 기반으로 측위를 진행할 시 CNN 모델을 통해 K의 값을 가변적으로 적용할 수 있는 시스템을 제안하였다. 이를 위해 측정치 대한 RSRP 이미지를 구축하고, 지도 학습을 사용하기 위한 레이블을 생성하도록 하였다. 그리고 측위 단계에서 학습이 완료된 모델을 통해 K의 값을 가변적으로 적용하였다. 도심 환경에서 실 데이터 기반으로 테스트를 진행한 결과 제안된 기법을 통해 K 값을 가변적으로 적용했을 때의 평균 위치 오차가 고정된 K 값을 사용했을 때보다 약 10.2 m 감소하는 것을 확인할 수 있었다. 또한 추정된 위치정보의 분산이 전체적으로 낮아지는 경향을 보였으며, 실제로 평균 표준 편차가 약 4.8 m 감소하는 것을 확인하였다. 이를 통해 제안된 기법이 고정된 K 값을 사용할 때보다 측위 성능이 향상됨을 검증하였다. 이에 따라 도심 환경에서 LTE 신호 기반 요구조자의 위치정보를 추정하기 위한 측위 시스템의 정확도가 향상될 수 있을 것으로 기대된다.

ACKNOWLEDGMENTS

This work was supported by Institute of Information & Communications Technology Planning & Evaluation (IITP) grant funded by the Korea government (MSIT) (No. 2019-0-01401, Multi-source based 3D emergency LOCalization using machine learning techniques).

AUTHOR CONTRIBUTIONS

Jae Uk Kwon contributed to the design and implementation of the algorithm and to the writing of the manuscript. Myeong Seok Chae contributed to provide information in writing the manuscript. Seong Yun Cho supervised the research and reviewed the manuscript as a project administrator. All authors discussed the proposed approach and results.

CONFLICTS OF INTEREST

The authors declare no conflict of interest.

References

  1. Amirisoori, S., Daud, S. M., Ahmad, N. A. Aziz, N., Sa'at, N., et al. 2017, WI-FI Based Indoor Positioning Using Fingerprinting Methods (KNN Algorithm) in Real Environment, International Journal of Future Generation Communication and Networking, 10, 23-36. https://doi.org/10.14257/ijfgcn.2017.10.9.03
  2. Cheng, R. S., Hong, W. J., Wang, J. S., & Lin, K. W. 2016, Seamless guidance system combining GPS, BLE beacon, and NFC technologies, Hindawi Publishing Corporation Mobile Information Systems, 2016, 1-12. https://doi.org/10.1155/2016/5032365
  3. Cho, Y. S. & Ji, M. I. 2019, Feasibility analysis on LTE RSRP fingerprint DB estimation using sparse war-driving collecting data for emergency location, ISGNSS 2019 in conjunction with IPNT Conference proceedings, 29 Oct - 1 Nov 2019, Jeju, Korea, 51-58. http://ipnt.or.kr/2019proc/6
  4. Ge, X & Qu, Z. 2016, Optimization WIFI indoor positioning KNN algorithm location-based fingerprint, 2016 7th IEEE International Conference on Software Engineering and Service Science (ICSESS), 26-28 Aug. 2016, Beijing, China, 135-137. https://ieeexplore.ieee.org/document/7883033
  5. Huang, H., Gartner, G., Krisp, J. M., Raubal, M., & van de Weghe, N. 2018, Location based services: ongoing evolution and research agenda, Journal of Location Based Services, 12, 63-93. https://doi.org/10.1080/17489725.2018.1508763
  6. Ismail, A. H., Kitagawa, H., Tasaki, R., & Terashima, K. 2016, WiFi RSS Fingerprint Database Construction for Mobile Robot Indoor Positioning System, 2016 IEEE International Conference on Systems, Man, and Cybernetics (SMC), 9-12 Oct. 2016, Budapest, Hungary, 1561-1566. https://doi.org/10.1109/SMC.2016.7844461
  7. Kingma, D. P. & Ba, J. L. 2015, Adam: A Method for Stochastic Optimization, ICLR, San Diego, 1-15. https://arxiv.org/abs/1412.6980
  8. Kolodziej, K. W. & Hjelm, J. 2006, Local positioning systems: LBS applications and Services (Boca Raton, FL: Taylor & Francis Group). https://doi.org/10.1201/9781420005004
  9. Li, B., Wang, Y., Lee, H. K., Dempster, A., & Rizos, C. 2005, Method for yielding a database of location fingerprints in WLAN, IEE Proceedings - Communications, 152, 580-586. https://doi.org/10.1049/ip-com:20050078
  10. Li, H., Xue, X., Li, Z., Li, L., & Xiong, J. 2021, Location Privacy Protection Scheme for LBS in IoT, Wireless Communications and Mobile Computing, 2021, 9948543. https://doi.org/10.1155/2021/9948543
  11. Lin, T.-N., Fang, S.-H., Tseng, W.-H., Lee, C.-W., & Hsieh, J.-W. 2014, A group-discrimination-based access point selection for wlan fingerprint ing localization, IEEE Transactions on Vehicular Technology, 63, 3967-3976. https://doi.org/10.1109/TVT.2014.2303141
  12. Liu, Y., Yang, Z., Wang, X., & Jian, L. 2010, Location, Localization, and Localizability, Journal of computer science and technology, 25, 274-297. https://doi.org/10.1007/s11390-010-9324-2
  13. Njima, W., Ahriz, I., Zayani, R., Terre, M., & Bouallegue, R. 2019, Deep CNN for Indoor Localization in IoT-Sensor Systems, Sensors, 19, 3127. https://doi.org/10.3390/s19143127
  14. Oh, J. T. & Kim, J. S. 2018, Adaptive K-nearest neighbour algorithm for WiFi fingerprint positioning, ICT Express, 4, 91-94. https://doi.org/10.1016/j.icte.2018.04.004
  15. Pecoraro, G., Domenico, S. D., Cianca, E., & Sanctis, M. D. 2018, CSI-based fingerprinting for indoor localization using LTE Signals, Eurasip Journal on Advances in Signal Processing, 2018, 274-297. https://doi.org/10.1186/s13634-018-0563-7
  16. Rose, N. D. R., Jung, L. T., & Ahmad, M. 2020, 3D Trilateration Localization using RSSI in Indoor Environment, International Journal of Advanced Computer Science and Applications, 11, 385-391. https://doi.org/10.14569/IJACSA.2020.0110250
  17. Sinha, R. S., & Hwang, S. H. 2019, Comparison of CNN Applications for RSSI-Based Fingerprint Indoor Localization, Electronics, 8, 989. https://doi.org/10.3390/electronics8090989
  18. Subedi, S., & Pyun, J. Y. 2020, A Survey of Smartphone-Based Indoor Positioning System Using RF-Based Wireless Technologies, Sensors, 20, 7230. https://doi.org/10.3390/s20247230
  19. Vo, Q. D. & De, P. 2016, A survey of fingerprint-based out-door localization, IEEE Communications Surveys & Tutorials, 18, 491-506. https://doi.org/10.1109/COMST.2015.2448632
  20. Xia, S., Liu, Y., Yuan, G., Zhu, M., & Wang, Z. 2017, Indoor Fingerprint Positioning Based on Wi-Fi: An Overview, ISPRS International Journal of Geo-Information, 6, 135. https://doi.org/10.3390/ijgi6050135