Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
Korea Information Processing Society
- Semi Annual
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
Domain
- Information/Communication > Information Processing Theory
2025.05a
-
본 논문은 디지털 이미지의 신뢰성과 콘텐츠 적절성을 판단하기 위한 서버 기반 통합 검증 시스템을 제안한다. EXIF 메타데이터 검증, SHA-256 기반 위·변조 감지, NSFW 필터링 기능을 통합하여, 이미지 업로드 시 서버가 자동 분석을 수행하고 검증된 콘텐츠만 저장되도록 구성하였다. NSFW 분류 실험은 DarkyMan/nsfw-image-classification 데이터셋 기반으로, 다양한 시각적 특성을 반영한 1805장의 이미지로 수행되었으며, ViT 기반 Falconsai 모델이 62.88%의 정확도를 기록하였다. 이는 fine-tuning 없이 사전학습 모델을 적용한 결과로, 구조적 적용 가능성과 개선 여지를 평가하는 데 의의가 있다. 또한 본 시스템은 WebSocket 기반 위치 연동, RDS 및 S3 저장소 구성, 인증 기반 접근 제어 등 보안 요소 확장 가능성도 함께 고려하였다.
-
AI의 분산 머신러닝(ML), 딥러닝(DL)에서 I/O 병목은 성능 저하의 주요 원인 중 하나이다. 특히 대규모 데이터셋을 사용하는 훈련 과정에서 데이터 로딩, 전처리, 네트워크 전송, 디스크 I/O가 전체 학습 속도에 큰 영향을 끼친다. 일반적으로 ML/DL의 워크로드는 읽기 의존성과 수많은 작은 파일들을 처리해야하는 특성을 가지고 있다. 이에 본 논문에서는 이를 해결하기 위한 아키텍처의 변화, 방향성과 방안들을 논한다. 특히 차세대 통합 메모리 GPU 환경에서 벤치마크를 통하여 관련 기술에 대한 성능을 측정하고자 한다.
-
Yu-Ji Son;Woo-Won Nam;Dong-Kun Lee;Su-min Im;Seor-Yeong Jeong;Se-won Kim 8
기존 가스 크로마토그래피(Gas Chromatography, 이하 GC) 분석은 고정된 장소에서 수행되어 시료 운송에 따른 시간 지연과 변질 문제가 있었다. 본 연구에서는 이를 해결하기 위해 이동식 소형 GC 장비에 연동 가능한 실시간 분석 소프트웨어를 개발하였다. 가상 시뮬레이션 기반으로 구현된 본 시스템은 데이터 시각화, 피크 탐지, 자동 보고서 생성 기능을 포함하며, 현장에서 즉시 분석이 가능하도록 설계되었다. 직관적인 사용자 인터페이스를 통해 현장에서도 간편하게 분석을 수행할 수 있도록 하였다. 이를 통해 운송비용 절감과 함께, 분석 결과 기반의 현장 대응 및 향후 센서 선택성 향상 가능성을 제시하였다. -
기존 커널에서의 zerocopy 는 SmartNIC 의 header/data split 기능과 페이지 정렬된 데이터를 요구하여 일반적인 환경에서는 제로카피 구현이 어려웠다. 본 연구는 이러한 한계를 극복하고자, 오늘날 데이터센터에서 널리 사용되는 NIC 의 LRO 기능을 활용하여 추가 하드웨어 없이 제로카피를 구현하였다. 이를 위해 비정렬 데이터도 직접 메모리에 매핑될 수 있도록 커널 로직을 개선하고, 사용된 메모리 페이지가 효율적으로 재사용되도록 메모리 회수 정책을 최적화하였다.
-
Woo-Jin Lee;Woo-Seong Choung;Hae-Yoon Jeong;Su-ah Lee;Youngjong Kim 12
본 논문에서는 협업 필터링과 콘텐츠 기반 필터링을 결합한 하이브리드 도서 추천 시스템인 LitMatch를 제안한다. "당신에게 맞는 책, 딱 맞게"라는 슬로건 아래, Neural Collaborative Filtering(NCF)과 BERT 기반 텍스트 임베딩을 통합하여 기존 추천 시스템의 한계인 cold-start 문제를 해결하고 추천 정확도를 향상시켰다. -
본 논문은 Renode 가상화 환경을 활용하여 임베디드 제어 소프트웨어를 설계하고 실제 액추에이터와 연동한 하드웨어-소프트웨어 통합 시뮬레이션 구조를 제안합니다. 실험을 통해 가상 제어기의 성능은 실제 제어기와 유사한 수준임을 확인하였으며, USB-CAN 통신에서 발생하는 지연과 같은 몇 가지 한계점도 함께 분석하였습니다. 본 연구는 가상 환경 기반 임베디드 시스템 개발 접근법의 가능성을 제시하고, 그리고 향후 실시간성 향상을 위한 개선 방향을 제안합니다.
-
3차원 모델링의 출현은 전자 상거래와 제품 디자인에서 문화유산 보존에 이르기까지 다양한 산업에 혁신을 가져왔다. 그러나 복잡한 물체의 고충실도 3D 모델을 캡처하는 것은 여전히 도전 과제로 남아 있다. 본 논문은 물리적 객체의 정밀한 디지털 복제를 효율적으로 생성하도록 설계된 제어 환경 시스템인 이미지 기반 모델러를 소개한다. 설정은 자동 회전 테이블과 통합된 6개의 동기화된 카메라를 통해 다각도의 이미지를 원활하게 캡처할 수 있도록 한다. 이러한 이미지는 고급 구조에서 모션 및 다중 뷰 스테레오 알고리즘을 사용하여 처리되어 상세한 3D 모델을 생성한다. 다양한 질감, 크기 및 기하학적 복잡성을 가진 물체를 포함한 일련의 실험을 통해 회전 비전의 성능을 평가하였다. 결과는 모델 정확도의 향상, 재구성 시간의 단축, 전통적인 정적 다중 카메라 설정에 비해 향상된 표면 세부 사항을 보여준다. 이 연구의 응용은 광범위하며, 빠르고 고품질의 3D 객체 디지털화를 요구하는 분야에 유익하다.
-
Seung-woo Lee;Beo-deul Kang;Hae-chan Jeong;Eun-ji Lim;Jae-soo Kim;Jae-jin Cho;Cheol-hee Lee 22
최근 V-SLAM 기술은 무인 로봇의 현장 파악을 위한 방법으로 연구되고 있지만, 대다수의 V-SLAM 기술은 높은 하드웨어 사양을 요구한다는 제약이 있다. 본 논문은 이를 극복하기 위해 저사양 기기에서도 성능을 보장할 수 있는 V-SLAM 기술 연구를 목적으로 하며, 이미지 분석을 위해 Canny와 ORB의 복합 알고리즘을 제시하였다. 상용화된 기존의 LSD와 ORB의 복합 알고리즘과 메모리 및 처리시간 비교를 통해 Canny와 ORB의 복합 알고리즘은 기존 알고리즘에 비해 높은 효율성을 가짐을 확인하였다. -
최근 ARM 아키텍처 기반 프로세서의 확산은 이기종 바이너리 실행을 위한 에뮬레이션 및 동적 바이너리 변환(Dynamic Binary Translation, DBT) 기술의 중요성을 더욱 부각시키고 있다. 본 연구는 Apple의 Rosetta 2 Linux와 오픈소스 기반의 QEMU-User 모드를 활용하여 x86_64 애플리케이션의 실행 성능을 비교·분석하는 것을 목적으로 한다. 성능 비교는 Native ARM 환경에서 기술의 실행 오버헤드를 다양한 벤치마크를 통해 측정하는 방식으로 수행되었다. 측정 결과는 두 기술의 실행 효율성과 실용성을 종합적으로 평가하는 데 활용되었다. 본 연구에서 제시하는 분석 결과는 멀티아키텍처 시스템 설계 및 이기종 컴퓨팅 환경 구축 시 적절한 기술 선택을 위한 실증적 근거를 제공한다.
-
기존 병렬 프로그래밍을 활용한 이미지 압축 관련 알고리즘 연구는 Joint Photographic Experts Group(JPEG) 관련 알고리즘이 주를 이루고 있었다. 따라서 Portable Network Graphics(PNG) 관련 연구가 필요하다고 판단하여, PNG 압축 알고리즘에 병렬프로그래밍과 GPGPU 개념을 도입해 더욱 빠른 압축 커널 설계 필요성을 생각했다. 이번 연구는 이미지 필터링, Lempel-Ziv 77 알고리즘, 허프만 코딩에 걸친 세 단계의 절차 중 이미지와 GPGPU의 특징 중 픽셀 단위와 다중 코어로 구성된 구조적 유사성을 고려하여 우수한 병렬화를 기대할 수 있는 이미지 필터링을 병렬 알고리즘으로 설계했다. 병렬 필터링 알고리즘은 CUDA 프로그래밍 모델의 블록 구조를 사용해 구현했으며 직렬 필터링 대비 약 190배의 가속화를 보였다. 추후 연구로는 이번 연구에서 다루지 않은 나머지 두 단계를 고려하여 포괄적인 병렬 PNG 압축 알고리즘을 설계하고자 한다.
-
최근 산업에 활용되는 사물인터넷 장치의 수가 기하급수적으로 증가하면서 인공지능을 활용한 빅데이터 학습의 효율성과 성능이 중요해지고 있다. 그러나 기존의 메모리 할당 방식은 리소스 소모, 응답 시간 지연, 에너지 소모 측면을 해결하지 못하고 있다. 본 논문은 오토인코더와 LSTM 모델을 결합하여 데이터 요청 빈도 수에 따라 메모리를 동적 할당하는 CPP-DMA 모델을 제안한다. 실험 결과에 따르면 random method 대비 처리 시간을 30.3% 단축하고 메모리 사용량을 18.1% 절감할 수 있었다.
-
생성형 인공지능의 확산과 데이터 확보 경쟁이 치열해지면서 고품질, 고부가가치 데이터를 유통, 거래할 수 있는 생태계 조성의 필요성이 높아졌다. 그러나 데이터 소유자는 주권 보장, 수익 배분의 불확실성으로 인해 데이터 개방과 제공에 소극적인 것이 현실이다. 데이터 클리어링하우스는 참여자 간 수익 배분 합의 메커니즘을 설정하고 분산형 데이터 처리기술을 적용한 유통 이력관리를 통해 고품질 데이터의 안전한 거래와 신뢰성을 확보할 수 있는 기술적 기반을 제공한다. 본 연구에서는 국가 데이터 통합 거버넌스 내에서 데이터 클리어링하우스 설치 및 운영에 필요한 기능 요구사항과 비스니스 시스템 아키텍처를 제안하고자 한다.
-
본 연구는 CycleGAN 을 활용하여 CT 와 MRI 간의 이미지 도메인 변환을 수행하는 방법을 제안한다. 의료 영상 분야에서는 서로 다른 촬영 기법 간의 도메인 불일치 문제가 존재하며, 특히 짝지어진 CT-MRI 데이터셋을 구축하는 것이 어려운 경우가 많다. 본 논문에서는 CycleGAN 의 구조를 기반으로 하여 두 도메인 간의 양방향 변환 모델을 설계하였으며 실험을 통해 도메인 간 구조적 정보 보존과 시각적 품질 측면에서 안정적인 변환 결과를 확인하였다. 본 연구 결과를 통해 의료 영상의 데이터 증강이나 MRI 촬영이 어려운 환자의 치료에 도움이 될 것으로 기대된다.
-
Eun-ji Lim;Seung-woo Lee;Beo-deul Kang;Hae-chan Jeong;Jae-soo Kim;Jae-jin Cho;Cheol-hee Lee 37
물류 로봇의 확산에 따라 SLAM(Simultaneous Localization and Mapping)의 중요성이 더욱 부각되고 있다. SLAM 프론트엔드 단계의 특징점 추출 및 디스크립터 생성은 시스템 성능에 직접적인 영향을 미친다. 기존의 ORB는 연산 효율은 높으나 정확도에 한계가 있으며, SuperPoint는 정확도는 우수하나 연산 자원이 많이 요구된다. 본 논문에서는 SuperPoint를 경량화하여 저사양 임베디드 환경에 적합한 구조로 설계하고, 실험을 통해 성능을 검증하였다. 그 결과, 제안된 모델은 정확도와 효율 측면에서 균형을 이루며 산업적 활용 가능성을 보여주었다. -
최근 AUTOSAR 기반 차량용 소프트웨어 개발에서 태스크 (Task)의 동작 흐름과 상태 전이를 실시간으로 파악하는 것은 시스템의 안정성과 타이밍 보호 (Timing Protection)를 보장하는 데 매우 중요하다. 특히 가상 ECU (Virtual ECU) 환경에서는 실제 하드웨어 없이도 에뮬레이션 기반의 분석이 가능하다는 장점이 있어, 개발 초기 단계에서의 오류 검출 및 최적화에 유용하다. 본 논문에서는 vECU 에뮬레이터를 활용하여 AUTOSAR OS 태스크의 실행 로그를 수집하고, 이를 시각적으로 분석하기 위한 실시간 Visualizer 툴을 설계 및 구현하였다.
-
본 연구는 기존의 요약과 학습을 위한 요약의 차별점을 제시하고, 교육 분야에서 활용 가능한 학습을 위한 요약 생성을 위한 LLM 기반 에이전트 개발 방법론을 제안한다. 에이전트는 30쪽 분량의 교육 자료를 대상으로 한 실험 결과, 최신 LLM에 프롬프트로 지시한 것보다 상세하고 학습에 유용한 요약본을 생성함을 확인한다. 본 연구의 결과는 LLM을 활용한 교육 자료 맞춤형 요약의 가능성을 보여주며, 학습자의 효율적인 학습을 지원하는 도구로서 활용될 수 있을 것으로 기대된다.
-
Randomized benchmarking (RB) techniques for measuring the error rate of quantum computers require a large number of sequences and repeated experiments for accurate error characterization. The cloud quantum computing service, IBM Quantum Platform, offered by IBM, utilizes a first-in, first-out (FIFO) job scheduler for the purpose of ensuring fair resource distribution. However, this scheduling policy is subject to a structural limitation, in that each sequence is queued and executed individually. In this paper, a method is proposed for integrating RB sequences composed of multiple sequences into a single task, with the objective of minimizing the queue waiting time. Experiments conducted on the IBM Quantum Platform demonstrated that the proposed method could effectively reduce the overall experimental time by 70.9% and decrease the pending overhead by 64.9% compared to conventional methods. Additionally, an efficient error characterization solution was proposed under the constraints of cloud quantum computing environments.
-
본 논문은 전통주 및 마이너한 주류 정보를 제공하는 사용자 중심 플랫폼에서의 인증 시스템 설계 및 구현 사례를 다룬다. 플랫폼의 다양한 기능 운영을 위해 마이크로 서비스 아키텍처(MSA)를 도입하고, 외부 로그인 기반의 JWT 에 사용자 식별자(userId)를 포함시켜 내부 시스템과 연동하였다. 이메일 기반 인증 구조를 개선하여 보안성과 유지보수성을 강화하였으며, 프로토타입 수준의 적용 흐름과 기대 효과를 제시한다.
-
Wooyoung Son;Sehoon Kim;Chanhee Hong;Honghyeon Kim;Sang-Hoon Choi;Ki-Woong Park 52
최근 다수의 기업과 국가기관은 서비스의 확장성 및 운용 효율성을 높이기 위해 클라우드 기술 도입을 활발히 추진하고 있다. 하지만, 기술의 빠른 확산에 비해 보안 대응은 미흡한 실정이며, 이를 보완하기 위해 다양한 클라우드 로그 분석 시스템이 제안되고 있다. 하지만, 기존 시스템의 경우, 멀티 클라우드 환경을 충분히 지원하지 않거나, 공격자 행위 분석 기준이 명확하지 않다는 한계점이 존재한다. 이에 본 논문에서는 AWS, Azure 및 GCP에서 API 또는 파일 기반으로 수집되는 다양한 보안 로그들을 STIX를 활용하여 정규화하고, STIX로 정형화된 로그로부터 사용자 및 시스템의 행위를 추출한 후, 이를 MITRE ATT&CK 프레임워크의 TTP와 매핑함으로써 잠재적인 보안위협을 식별하는 시스템을 제안한다. -
Jeongeun Ryu;Seoyun Kang;Jueun Son;Yumin Lee;Seongmin Kim 54
최근 코드로서의 정책(Policy as Code, PaC)이 클라우드 환경에서 주목받고 있으나, 여러 운영 환경에 대한 안정적인 지원은 아직 제한적이다. 본 연구에서는 쿠버네티스 환경에서 PaC를 적용하기 위한 엔진들을 비교 분석하고, 효율적 사용을 위한 고려 사항들을 제시한다. -
Moohyun Song;Woohyeok Park;Yongha Bae;Jongmin Kim;Donghun Kim;Jangho Kim 56
본 논문에서는 클라우드 인프라 환경에서 발생하는 복잡한 비용 구조를 자동으로 분석하고 최적화할 수 있는 AI 기반 클라우드 비용 최적화 에이전트 시스템인 CostNorm을 제안한다. CostNorm은 자연어 인터페이스, 대규모 언어모델(LLM), 서버리스 아키텍처를 기반으로 구성되며, 사용자 질의에 따라 실시간으로 자원 사용 현황을 분석하고 비용 절감 조치를 수행한다. 컴퓨팅, 스토리지, 네트워크의 세 가지 자원 영역을 중심으로 각기 다른 과금 구조와 사용 패턴을 자동으로 인식하고, ARM64 및 Spot 인스턴스로의 마이그레이션, 스토리지 클래스 전환, 트래픽 경로 최적화와 같은 다양한 전략을 통해 최적의 자원 구성을 제안한다. 실제 시나리오 기반 평가 결과, 컴퓨팅 비용에서 최대 79.2%, 스토리지에서 최대 95.7%, 네트워크에서 최대 88.9%의 비용 절감 가능성을 보여주었다. 본 연구는 AI 에이전트가 클라우드 비용 관리에 기여할 수 있는 잠재력을 확인하고, 차세대 FinOps 자동화 시스템의 방향성을 제시한다. -
Hye-Yeon Hyeon;Ka-Hyun Kim;Mi-Jin Kim;Ji-Yeon Lee;Ji-Won Yoo;Seng-Min Kim 58
최근 클라우드 인프라 구축에서 보안까지 통합 관리하는 DevSecOps의 중요성이 커지고 있으며, 코드형 인프라는 이를 자동화하는 핵심 기술로 활용되고 있다. 특히 Terraform이 가장 많이 사용되고 있는데, 이것은 Public cloud뿐 아니라 On-premise 환경에서도 Kubernetes를 자동으로 구성할 수 있는 도구이다. 본 연구는 On-premise 환경에서 Terraform을 활용해 Kubernetes를 구축할 수 있는 세가지 Matchbox, Rancher, Proxmox 기반 방식을 비교 분석하였다. 이를 통해 On-premise 환경에서도 Terraform 기반의 IaC를 활용한 Kubernetes 구축이 충분히 실현 가능함을 입증하였다. -
최근 클라우드 컴퓨팅 환경에서는 벤더 종속성을 완화하고 서비스 유연성을 확보하기 위한 방안으로 멀티 클라우드 및 멀티 클러스터 전략이 활발히 채택되고 있다. 그러나 이러한 분산된 인프라 환경에서는 네트워크 구성 방식에 따라 통신 성능이 민감하게 영향을 받을 수 있다. 본 연구에서는 AWS와 GCP를 기반으로 멀티 클라우드 및 멀티 클러스터 인프라를 구축하고, 다양한 구성 조건에서 가상 머신 및 파드 간 통신 성능을 정량적으로 비교·분석하였다. 이를 바탕으로 멀티 클라우드 및 멀티 클러스터 환경의 네트워크 설계 시 성능 영향을 고려한 전략 수립의 필요성을 제시한다.
-
클라우드 환경에서는 다양한 사용자에게 컴퓨팅 자원을 효율적으로 제공하기 위해 가상화 기술이 폭넓게 활용되고 있다. 그러나 가상화 계층은 디스크 I/O 경로에 추가적인 오버헤드를 발생시켜, 서비스 성능 및 시스템 응답성 저하를 초래할 수 있다. 본 연구에서는 KVM 기반 VM 환경을 대상으로, 디스크 볼륨 구성(RAID, LVM-linear, LVM-stripe)과 페이지 캐시 사용 여부가 I/O 성능에 미치는 영향을 정량적으로 분석하였다. 분석 결과는 클라우드 인프라의 디스크 및 캐시 구성 전략 수립에 있어 실질적인 참고 기준으로 활용될 수 있을 것으로 기대된다.
-
Hyeyoung Cho;Junyoung Park;A-young Son;Gi-Mun Jeong 64
최근 인공지능(AI) 및 빅데이터 기술의 비약적인 발전에 따라, 고성능컴퓨팅(High Performance Computing, HPC) 환경에 대한 요구는 점차 고도화되고 다변화되고 있다. 이에 따라 기존의 베어메탈 기반 인프라에서 벗어나, 사용자 맞춤형 자원 할당이 가능한 클라우드 기반 HPC 환경의 필요성이 증가하고 있다. 한국과학기술정보연구원(KISTI)은 이러한 요구를 반영하여 HPC 사용자 대상 R&D 플랫폼인 KI Cloud를 개발하였다. 본 논문에서는 KI Cloud 상에서 다양한 HPC 워크로드를 효과적으로 지원하기 위한 데이터 플랫폼의 설계 및 구현 방안을 제안한다. 특히, 멀티 클러스터 환경의 스토리지 유형을 고려한 통합 데이터 처리 구조를 중심으로 데이터 플랫폼 아키텍처를 설계하였다. -
마이크로서비스 아키텍처의 확산에 따라 서비스 간 안전한 통신을 보장하는 기술의 중요성이 더욱 부각되고 있다. 서비스 메시는 이러한 환경에서 보안성과 관측 가능성을 제공하는 핵심 인프라이며, 그중 mTLS 는 상호 인증을 통해 통신의 기밀성과 무결성을 보장하는 주요 보안 메커니즘으로 활용된다. 본 논문은 Istio, Linkerd, Consul, Kuma 등 다양한 서비스 메시 환경에서 mTLS 적용이 네트워크 성능에 미치는 영향을 비교·분석하였다. 실험 결과, mTLS 를 활성화한 모든 환경에서 성능 저하가 관측되었으며, 이는 암호화 및 인증서 처리 과정에서 발생하는 연산 부담이 주요 원인으로 작용했을 가능성을 시사한다. 이러한 결과는 서비스 메시 도입 시 보안성과 성능 간의 트레이드오프를 고려한 mTLS 의 선택적 적용 전략이 필요함을 보여준다.
-
마이크로서비스의 확산으로 인해 서비스 메시는 클라우드 네이티브 환경에서 필수적인 구성 요소가 되었으며, Istio 는 이를 대표하는 솔루션으로 널리 활용되고 있다. 그러나 기존 Istio 사이드카 모드는 리소스 낭비와 지연 문제를 야기해 이를 보완하기 위한 앰비언트(Ambient) 메시 구조가 제안되었으나, 두 구조 간 운영 특성 및 성능에 대한 정량적 비교는 여전히 미흡하다. 본 논문에서는 사이드카 모드와 앰비언트 모드의 아키텍처를 비교·분석하였다. 실제 운영 환경을 모사한 실험을 통해 두 모드의 성능을 측정한 결과, 앰비언트 모드는 사이드카 모드 대비 지연 시간이 6.2% 단축되고 CPU·메모리 사용량이 각각 37%, 14% 감소함을 확인하였다.
-
기존의 AWS IAM 보안 솔루션인 AWS Access Analyzer, Policy Sentry, Parliament 등은 주로 정적 분석에 기반한 기능을 제공하며, 실시간 로그 기반의 권한 최적화 및 자동화 측면에서는 한계가 존재한다. 이러한 한계를 보완하고자, 본 연구에서는 AWS CloudTrail 로그 데이터를 활용하여 불필요한 역할 및 권한을 자동으로 식별하고, 최소 권한 원칙에 따라 이를 최적화하는 시스템을 제안한다. 제안된 시스템은 실시간으로 권한 사용 패턴을 분석하고, 과도하게 부여된 권한은 제거하며, 업무 수행에 필요한 권한은 자동으로 추천함으로써 정책의 정밀도를 높인다. 이를 통해 보안성을 강화하는 동시에 효율적인 IAM 정책 관리가 가능하며, 본 연구에서는 이를 실험을 통해 검증하였다.
-
KISTI에서는 2015년부터 KREONET-S라는 프로젝트를 진행하였으며, SDN 기술을 활용한 네트워크 인프라를 구축하였다. KREONET-S 네트워크 인프라를 통해 가상전용망(VDN, Virtual Dedicated Network) 기술을 개발하였으며, 네트워크 슬리이싱 서비스를 사용자들에게 제공하고 있다. 하지만 VDN 기술은 사용자의 요청이 들어오면 이를 관리자가 직접 VDN을 생성하는 구조로 구현되어 네트워크의 규모가 확장되면서 관리자에 대한 관리 측면에서의 비용증가와 휴먼에러 문제가 발생할 수 있다. 이를 해결하기 위해 화이트 리스트 기반의 VDN 자동 생성 기술을 개발하였다. VDN 자동 생성 기술은 SDN 환경에서 목적지의 주소를 SDN 스위치가 알지 못하는 경우 컨트롤러로 Packet_IN 메시지가 전달되는데, 이때 발생하는 Packet_IN 메세지를 이용하여 VDN을 자동 생성할 수 있는 환경을 만들고자 한다. 또한 사용자가 데이터를 전송하더라도 화이트리스트를 통해 검증된 MAC주소에 대해서만 자동으로 VDN을 생성할 수 있도록 개발하여 보안 측면을 강화하였다. 본 논문에서는 SDN 기반의 VDN 자동 생성 기술 개발에 대해 자세하게 설명하고자 한다.
-
최근 광역 네트워크의 신속·안전성이 중요해지면서 위성간 통신이 다양한 산업의 필수 인프라로 자리 잡았다. 그러나 위성통신은 넓은 지역에 전파가 확산되므로 재밍·도청 공격에 취약하고, 하드웨어적 제약으로 고성능 보안 기법을 적용하기 어렵다는 한계가 있다. 본 논문에서는 위성통신 환경에서 데이터의 기밀성과 무결성을 높이면서도 복잡한 연산을 요구하지 않는 샤미르 시크릿 쉐어링 기반 주파수 호핑 기법을 제안한다. 실험에 따르면, 제안 방식은 재밍 강도가 증가할수록 종래 방식 대비 약 9.5% 높은 데이터 복원율을 보였으며, 재밍 발생 확률 70% 구간에서 종래 방식과 달리 100%의 복원율을 유지했다. 또한 종래 방식 대비 도청 성공률이 평균 30.6% 낮았다.
-
사물인터넷 기기 증가로 무선 네트워크에서 송수신 되는 데이터를 노린 악의적인 공격이 늘고 있다. 그러나 기존 탐지 방식은 낮은 탐지 성능과 높은 연산 부하를 가지는 한계가 있다. 본 논문은 자원이 충분한 access point (AP)와 경량 장치가 머신러닝 모델의 학습과 탐지를 분담하여 수행함으로써 탐지 성능과 효율성을 모두 개선할 수 있는 방법을 제안한다. 실험 결과에 따르면 종래 모델 대비 제안 모델의 탐지율은 평균적으로 약 38%, 데이터 전송 성공률은 약 17.75% 개선되었다.
-
스마트 홈 환경에서 다양한 서비스가 동시에 사용되면서 네트워크 QoS(Quality Of Service)를 고려한 효율적인 패킷 관리 기술의 필요성이 증가하고 있다. 최근 QoS 요구사항을 고려한 패킷 관리 기술에 관한 연구가 진행되고 있으나, 동시에 실행되는 애플리케이션 수가 적은 상황에서 지연이 크다는 문제점이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 동시 실행 애플리케이션의 지연 시간과 서로 다른 QoS 요구사항을 동시에 만족시키기 위한 동적 패킷 스케줄링 기법을 제안한다. 실험 결과에 따르면 제안하는 기법은 종래 기법 대비 평균 패킷 지연도를 약 43% 개선했고, 패킷 손실률을 약 29% 감소시켰다.
-
5G 이동통신 네트워크에서 가상화(NFV)를 지원하는 SA(Standalone) 구조가 등장함에 따라, 로밍서비스는 기존의 단일화된 홈 라우팅 방식에서 로컬 브레이크아웃(Local-Breakout) 방식을 구조적으로 도입하였다. 두 가지 로밍 서비스 아키텍처의 제어 평면(Control Plane)에서 패킷 전송 경로를 분석하고, 로밍 설계 시 고려해야 할 보안 문제를 도출하고자 한다.
-
위성 통신은 전송 지연 및 데이터 손실 없이 안정적인 실시간 상호작용이 필요하지만, 긴 전파 거리, 제한된 주파수 자원, 채널 상태의 불안정성 등으로 인해 지상 대비 데이터 손실률과 전송 지연이 크다. 이러한 문제를 해결하기 위해 본 연구는 다중 링크 전송에서 위성 간 통신을 위해 네트워크 코딩을 적용하여 서비스 거부 공격과 같은 결함 상황에서도 저지연으로 데이터 복구가 가능한 모델을 제안한다. 평가 결과에 따르면 채널 손실에 대해 종래 모델 대비 복구 실패율을 33.9% 줄였다.
-
멀티링크를 지원하는 무선 네트워크 장치의 전력 효율은 모바일 장치의 배터리 수명, 시스템 성능, 네트워크 품질에 영향을 미치는 중요한 요소이다. 종래의 전송 방식은 트래픽이 발생할 때마다 링크가 활성화되어 전력 소모가 증가하는 문제가 있다. 이러한 문제를 해결하기 위해 본 연구에서는 트래픽 특성에 따라 스케줄링하고 링크를 제어하는 전송 기법을 제안한다. 실험 결과에 따르면, 제안 방식은 기존 방식 대비 멀티링크 환경에서 전력 소모량을 약 32% 줄일 수 있었다.
-
기존 소프트웨어 기반의 패킷 왕복 시간(RTT, Round Trip Time) 측정 방식은 추가적인 소프트웨어 계층의 오버헤드로 인해 정확성이 저하되는 한계점이 있었다. 그러나 FPGA 기반의 NIC을 사용하는 경우 아키텍처 수정이 가능하므로, 하드웨어 기반의 RTT 측정이 가능해진다. 본 논문에서는 FPGA 기반의 AMD OpenNIC 아키텍처에 RTT 측정 기록용 모듈을 추가하여 별도의 외부 장비 없이 고정밀 RTT를 직접 측정하는 방법을 보이고자 한다. 제안된 모듈은 250MHz의 주파수에서 동작하고 최대 4ns 단위로 RTT 측정이 가능하며, 20ns 내의 측정 오차만 보여 기존 소프트웨어 방식 대비 높은 정확성을 보인다. 본 기술은 향후 다양한 네트워크 환경에서의 성능 평가 및 최적화 연구에 활용이 가능할 것으로 기대된다.
-
네트워크를 대상으로 하는 공격자는 네트워크 트래픽을 분석하고 이를 통해 네트워크 토폴로지를 추론하고 Link Flooding이나 DoS와 같은 공격을 수행한다. 본 논문에서는 이러한 공격에 대응하기 위해 P4 기반의 새로운 라우팅 경로 난독화 알고리즘을 제안한다. 이 알고리즘 방식은 네트워크 중간에 배치된 P4 스위치에서 패킷 포워딩 시 다음 홉을 무작위로 선택하여 라우팅 경로를 난독화함으로써 공격자가 라우팅 경로나 네트워크 토폴로지를 파악하는 것을 어렵게 한다. 또한, P4를 통해 몇 가지 변수를 정의함으로써 패킷이 네트워크에서 무한 루프에 빠지는 것을 방지하고 목적지에 도달하는 것을 보장한다. 더불어, 이러한 무작위 포워딩은 대규모 트래픽 공격이 발생했을 시 트래픽을 분산시켜 네트워크 자원 고갈 공격의 영향을 완화하는 효과를 가진다. 또한, 본 논문은 P4의 프로그래밍 가능성을 통한 유연한 난독화 가능성을 제시한다.
-
5G 코어 네트워크는 컨테이너 기반 마이크로서비스 아키텍처와 쿠버네티스 오케스트레이션을 통해 유연하고 확장 가능한 구조를 구현하였다. 그러나 멀티 클러스터 및 Multus CNI 기반의 다중 인터페이스 환경에서는 NGAP, PFCP, GTP-U 와 같은 5G 특화 프로토콜이 복합적으로 운용되며, 종단 간 트래픽을 효과적으로 관측하기 어렵다. 기존의 사이드카 기반 서비스 메시 솔루션은 HTTP 트래픽 중심으로 설계되어 이러한 구조를 충분히 지원하지 못하는 한계가 있다. 본 연구에서는 eBPF 를 활용하여 NGAP, PFCP, GTP-U 를 포함한 모든 인터페이스의 5G 트래픽을 실시간으로 추적할 수 있는 관측 시스템을 제안하고, free5GC 기반 실험을 통해 그 효과를 검증하였다.
-
5G 네트워크는 클라우드 네이티브 및 마이크로서비스 아키텍처 기반으로 설계되어 고속성, 저지연성, 대용량 연결을 지원하는 차세대 통신 인프라로 자리 잡고 있다. 이에 따라 각 네트워크 기능(NF)은 컨테이너 단위로 구성되어 클러스터 환경에서 운영되며, 확장성과 유연성을 제공하는 한편, 기능혼재에 따른 보안 경계의 불명확성과 구조적 복잡성으로 인해 다양한 보안 취약점을 내포하게 된다. 본 논문에서는 5G 코어 네트워크를 기능적 역할 기준으로 분류하고, 현재 구조의 보안 및 운영상 문제점을 분석하였다. 이를 해결하기 위한 방안으로, 민감도 기반의 NF 분리를 통해 각 기능을 독립적인 클러스터에 배치하고, mTLS 기반의 클러스터 간 통신 보호를 적용한 멀티 클러스터 보안 강화아키텍처를 제안한다. 이를 통해 민감 정보 보호, 침해 확산 억제, 정책 기반 흐름 제어를 실현하고, 5G 네트워크의 보안성과 운용 유연성을 동시에 향상시키고자 한다.
-
Sangwoo Shin;Yunhwa Shin;Jinyeong Lee;Jeongsik Choi 101
본 연구에서는 6G 시대의 핵심 기술인 integrated sensing and communication(ISAC)의 실험적 검증을 위해, radio frequency system-on-chip(RFSoC)을 기반으로 한 HW/SW 프로토타입 시스템을 개발하였다. 제안된 시스템은 다양한 변조 방식을 이용한 무선 송수신 실험을 통해 통신 성능을 평가하고, 실내 환경에서 사람을 대상으로 한 센싱 실험을 통해 환경 인지 성능을 검증하였다. 또한, 클라이언트-서버 기반 실시간 처리 시스템을 구현하여 수집된 데이터를 실시간으로 분석하고 시각화하는 대시보드를 구성하였다. 실험 결과, 제안된 ISAC 시스템이 24 GHz 대역에서 통신과 센싱 기능을 실시간으로 동시에 수행할 수 있음을 확인하였다. 제안된 시스템은 실시간 ISAC 플랫폼으로서 6G 기술 개발에 중요한 기여를 할 수 있으며, ISAC 기반 무선 네트워크 연구에 활용 가능한 유용한 참조 모델이 될 것으로 기대된다. -
Byeongchan Yang;Sehyeon Oh;Joohyoung Cha;Jemin Lee;Yongin Kwon 106
본 연구는 엣지 컴퓨팅 환경에서 널리 사용되는 라즈베리파이 5의 AI 연산 성능 한계를 분석하고, 이를 보완할 수 있는 Hailo 기반 AI 가속기의 활용 가능성을 탐색하였다. 이미지를 분류를 위한 트랜스포머 기반 AI 모델 활용하여, 라즈베리파이 5를 사용한 경우와, Hailo-8 또는 Hailo-8L 모듈을 함께 사용한 경우의 연산 성능을 비교 분석하였다. 실험 결과, Vit Base BN 모델을 기준으로 Hailo-8을 활용했을 때 약 81.8%의 성능 향상이 나타났으며, 이를 통해 엣지 디바이스에서의 실시간 AI 처리 효율이 개선됨을 확인할 수 있었다. -
Changhan Lee;Jaehoon Yang;Minwook Lee;Jaebin Oh;Dong Kun Noh 108
에너지 수집형 AIoT 디바이스에서 연합학습을 수행할 때 에너지 수급의 불균형은 학습 성능과 서비스 가용성에 치명적인 영향을 미친다. 본 연구에서는 이러한 문제를 해결하기 위해 각 디바이스의 현재 에너지 상태에 따라 학습 모델의 경량화 수준을 달리 적용하는 에너지 적응적 프루닝 모델 선택 기법을 제안한다. 제안 기법은 딥러닝 모델의 불필요한 채널을 제거하는 네트워크 슬리밍 기반 프루닝을 활용하여, 에너지가 부족할 때는 경량 모델로 에너지 소비를 줄이고 에너지가 충분할 때는 원래 모델로 높은 정확도를 확보하도록 설계되었다. 이를 통해 노드의 정전 발생 시간을 최소화하면서도 높은 모델 정확도를 유지할 수 있어, 연합학습의 추론 품질을 높이는 동시에 사용자에게 안정적인 추론 서비스를 제공할 수 있다. -
임베디드 시스템은 자원 제약과 보안 취약성이 크며, 기존 네이티브 코드 기반 개발 방식은 이식성과 안전성 측면에서 한계가 있다. 본 논문에서는 이러한 문제를 해결할 방안으로 WebAssembly의 활용 가능성을 제시한다. WebAssembly는 다양한 언어로 작성된 코드를 공통된 바이너리로 변환해 여러 플랫폼에서 실행할 수 있으며, 샌드박스 기반의 격리 환경과 자원 접근 제한을 통해 보안성도 확보할 수 있다. 이를 통해 임베디드 시스템에서의 안정적이고 이식성 높은 실행 환경 구축이 가능함을 보이고, 향후 런타임 경량화, 성능 분석, 보안 검증 등의 연구 방향을 제안한다.
-
Ji-Min Kim;Ji-Hye Yoon;So-Hee Lim;Hye-Min Hong;Sungwook Kim 113
최근 딥러닝 기반 음성 합성을 이용한 보이스피싱 범죄가 대두되고 있다. 본 연구에서는 딥보이스 피싱 탐지 모델을 개발한다. 특히 제안 모델은 기존 연구와 달리 모바일 환경에서 실시간으로 동작한다. 이를 위해 기존 VGG 모델을 경량화하였으며 성능 평가를 통해 경량 모델에서도 높은 탐지 정확도 및 빠른 응답 속도를 제공하는 것을 실증하였다. 구체적으로, 실시간 응답용 경량 모델 정확도가 98.05%로 비실시간으로 동작하는 경량 전 모델의 정확도 98.15%를 거의 유지한다. 또한 Samsung Galaxy S9+ 단말에서 음성 신호 처리 및 모델 판별까지 전체 프로세스 수행 시간이 150ms 정도로 실시간 응답 처리가 가능했다. -
본 연구는 Union Select 기반 SQL Injection의 위험성을 분석하고, PDO를 활용한 Prepared Statement 기법으로 효과적인 방어가 가능함을 실험을 통해 입증하였다.
-
디바이스 드라이버는 운영체제가 마우스, 키보드, 하드디스크 등 하드웨어와 상호작용할 수 있게 해주는 소프트웨어이며, 공급 업체가 하드웨어를 판매하면서 써드파티 디바이스 드라이버도 함께 배포하고 있다. 그러나 기업의 내부망까지 전달되어 사용된다는 점을 악용하여 공급망 공격에 사용되고 있다. 최근 북한의 해킹 조직으로 알려져 있는 Lazarus 그룹은 드라이버의 취약점을 이용하는 공격인 BYOVD(Bring Your Own Vulnerable Driver) 기법을 사용하여 국내 사용자 및 기업의 시스템에 공격을 시도하였다. 윈도우 디바이스 드라이버 취약점 탐지 자동화에 대한 연구들이 진행되고 있으며, 특히 커널 스택 버퍼 오버플로우 혹은 메모리 임의/쓰기 취약점 탐지 연구들이 존재한다. 본 논문에서는 윈도우 커널 메모리 중 동적할당 된 커널 풀 메모리 버퍼 오버플로우 취약점 탐지 자동화를 연구하였다. 기호 실행 도구로 잘 알려진 Angr 프레임워크를 사용하였으며, 연구 결과 취약점을 탐지하는 것을 확인하였다.
-
AI(Artificial Intelligence) 시대가 도래됨에 따라 범국가적인 형태로 AI 산업 시장에서 기술 패권을 선도하고자 하는 노력이 이루어지고 있다. 해당 분야에서 가장 중요시 되고 있는 것은 데이터이다. 양질의 데이터를 보유하고 있다는 것은 AI 기술을 활용하여 양질의 데이터를 생성할 수 있음을 의미한다. 이에 따라 AI 기술에 기반을 두고 있는 기업들은 자동으로 데이터를 크롤링하기 위하여 AI 스크래퍼를 인터넷 상에 배포하고 있다. 하지만, AI 스크래퍼를 통해 데이터를 크롤링할 시 발생하는 트래픽으로 인하여 시스템 중단이 초래될 수 있을 뿐만 아니라 검증되지 않은 데이터가 크롤링되어 학습이 이루어지는 경우, 생성형 AI 모델 붕괴를 초래함으로써 성능 저하로 이어질 수 있다. 이에 본 논문에서는 인터넷 상에 무분별하게 배포되어 있는 AI 스크래퍼가 오염 공격에 노출되었을 경우, 미칠 수 있는 파급력을 SEIR 전염병 모델을 통해 정량적으로 분석하며, 이를 통해 대규모 시스템에서 단일 감염으로 인한 확산이 큰 파급효과를 불러일으킬 수 있음을 보인다.
-
최근 인공지능 기술이 발전하면서 보이스 피싱 수법도 점점 정교해지고 있다. 따라서, 실시간 탐지 기능을 갖추면서도 높은 정확도를 유지할 수 있는 기술적 접근이 필요하다. 본 논문에서는 STT(Speech-to-Text) 기반 탐지, 음성 주파수 분석, 딥러닝 기반 탐지, 화자 인식 기술 등 네 가지 탐지 기법을 대상으로 정확도, 반응 속도, 범용성, 자원 소모량 등의 기준을 바탕으로 성능을 평가하였다. 분석 결과, 각 기술은 고유한 장점과 한계를 지니고 있었다. 이에 본 연구에서는 STT 기반 기술의 실시간 탐지 기능과 딥러닝 기반 기술의 높은 정확도를 결합한 탐지 방안을 제안하며, 추가적으로 음성 주파수 분석 기법을 보완적으로 활용할 것을 권장한다. 본 연구의 결과는 보이스 피싱 피해 예방뿐만 아니라 향후 음성 인식 기반 범죄 대응 기술 개발에도 기초 자료로 활용될 수 있을 것이다.
-
에어 갭 환경은 물리적으로 시스템을 분리하여 사이버보안을 강화하기 위해 활용된다. 에어 갭 환경의 보안을 실질적으로 강화하기 위해서는 에어 갭 공격에 관한 연구가 필요하다. 본 논문에서는 스크린세이버를 이용한 에어 갭 공격 기법을 제안하고 공격 실현 가능성을 입증한다. 제안 방식은 비눗방울 스크린세이버 외에도 리본, 3차원 텍스트 등 다양한 시각적 요소에 적용 가능하며, 수십 미터에 이르는 전송 범위를 가지고 탐지 회피성이 높다는 장점이 있다. 실험에 따르면 QR 코드를 이용한 공격 방식보다 공격 가능 커버리지가 약 14배 증가했다.
-
컨테이너 기술은 Virtual Machine(이하 VM) 보다 애플리케이션의 경량화와 배포 간소화에 유리해 클라우드 환경에서 널리 사용되고 있다. 그러나 VM에 비해 보안 측면에서 더 많은 위험에 노출될 수 있으며, 특히 컨테이너 탈출(Container Escape) 취약점은 큰 위협이 된다. 이는 격리된 컨테이너가 호스트 시스템에 접근하는 심각한 보안 문제로, 본 논문에서는 주요 컨테이너 탈출 취약점을 이용, 공격을 실제로 진행하면서 원인을 파악하여 Docker 기반 환경의 보안 강화를 위한 실질적인 참고자료를 제공하고자 한다.
-
본 논문은 기존 STRIDE 위협 모델링의 한계를 보완하고자 시스템 제어 구조 기반의 STPA 기법을 STRIDE와 통합한 새로운 보안 위협 모델링 방법론을 제안한다. 제안된 방법은 위험한 제어행위(UCA)를 도출하고 이를 STRIDE 위협 범주에 매핑하여 시간적·상태적 조건 및 복합 시나리오를 체계적으로 분석할 수 있도록 한다. 본 연구에서는 차량통합제어장치(ICU)의 기능 중 도어 제어 시스템을 중심으로 절차를 설명하고 이후 ICU 전체 기능에 확장 적용하여 분석한 결과, 제안한 접근법이 기존 방법 대비 92%의 정밀도를 달성함을 확인하였다. 이는 차량 개발 초기 단계에서의 보안 요구사항 도출 및 위협 대응 전략 수립에 효과적인 분석 수단으로서의 가능성을 입증한다.
-
랜섬웨어는 공격자가 시스템 침투 후 데이터를 암호화하여 정상적인 접근을 차단하고 복호화를 위해 금전을 요구하는 악성 소프트웨어이다. 이러한 랜섬웨어 공격에 대응하기 위해 현재 많은 연구가 진행되고 있다. 기존 연구들은 랜섬웨어가 가진 다수의 특성을 활용해 탐지를 시도하나, 많은 특성 사용으로 인한 시간·자원 소모와 분류 정확도의 한계가 문제로 남는다. 이러한 문제를 해결하기 위해 본 논문은 Feature Importance 알고리즘 중 Gain Ratio를 활용하여 K값 기준으로 최적화된 데이터셋을 구성하고 이를 통해 머신러닝 모델을 학습하여 탐지하는 방법을 제안한다. 실험 결과, RF 모델은 K=0.3에서 99.41%, DT는 96.96%, SVM은 K=0.1에서 97.65%, MLP는 K=0.3에서 98.14%의 분류 정확도를 달성하였다.
-
본 연구는 리눅스 커널 io-uring 서브시스템의 설계 결함에서 기인한 취약점을 중심으로, 전통적인 메모리 보호 기법이 간과한 새로운 Page-OOB 취약점 및 공격 경로를 분석한다. 취약점에 대한 상세한 분석을 바탕으로 이에 대한 완화 가능성 및 추후 연구 방향을 탐색해보고자 한다.
-
Rowhammer는 CPU 기반 DRAM에서 공격이 유효함을 입증해왔다.본 연구에서는 이러한 rowhammer 공격이 NVIDIA GPU와 GPU의 메모리인 GDDR6에서도 적용 가능한지 알아보았다. 그결과, GPU의 메모리 및 최신 GPU 아키텍처는 rowhammer의 비트 역전 현상을 발생시킬 수 있는 여지가 있으나, 단순한 고속 접근만으로는 rowhammer 비트 역전 현상을 일으킬 수 없었다. 이와 관련하여 실제로 비트 역전 현상을 일으키기 위해서는 메모리에 적용되어 있는 TRR 등의 mitigation을 우회해야 하므로, 더 정교하고 다양한 메모리 접근 패턴을 시도해볼 필요가 있다.
-
ROS2(Robot Operating System)은 로봇 애플리케이션 개발을 위한 소프트웨어 라이브러리 모음으로, 다양한 사이버-물리 시스템(Cyber-Physical System, CPS) 개발에 폭넓게 활용되고 있다. 본 연구에서는 ROS2 의 구조적 특성에 착안하여, 기존에 실용적인 한계가 존재했던 기호 실행(Symbolic Execution) 기법을 ROS2 애플리케이션에 적용하기 위한 새로운 방법론을 제안한다. 또한, 간단한 ROS2 애플리케이션에 기호 실행을 적용한 사례 분석을 통해 새로운 방법론의 실용 가능성을 탐색한다.
-
기존의 연합학습은 데이터가 균일하게 분포된(Independent and Identical Distirbution, IID) 환경에서 좋은 성능을 보였지만 데이터가 불균일하게 분포된(non-Independent or Identical Distribution, non-IID) 환경에서는 성능이 하락하는 문제가 존재한다. 또한 연합학습에서 데이터의 원본을 보내는 대신 모델 파라미터를 전송함에도 불구하고 서버가 모델 파라미터를 활용하여 원본 데이터를 복구하는 공격이 진화하고 있다. 따라서 본 논문은 non-IID 환경에 적합한 프라이버시 보호 연합학습 프레임워크인, FedHEA(a privacy-preserving Federated Learning framework via Homomorphic Encryption-based Aggregation)을 제안한다. FedHEA는 클라이언트의 모델 파라미터를 동형암호 중 하나인 CKKS로 암호화함으로써 프라이버시를 보호하고 데이터 분포 기반 클러스터링을 통한 클라이언트 선택 및 클라이언트 로컬 데이터 조정 과정을 통해 non-IID 환경에서 고품질의 글로벌 모델을 형성한다. 향후, weighted aggregation 연산에서의 효율을 개선하기 위하여 반복되는 연산 구조를 병렬적으로 구성하고 FedHEA의 성능을 실험적으로 증명할 예정이다.
-
본 연구는 DDoS와 랜섬웨어 두 가지 공격을 동시에 탐지할 수 있는 하이브리드 머신러닝 모델과 탐지 이후 데이터 복구를 위한 XOR 기반 복구 기법을 제안한다. 실험 결과에 따르면 제안한 하이브 리드 모델은 CNN 대비 평균 17.3%, GRU 대비 2.36% 높은 정확도를 보였으며, XOR 기법을 적용한 경우 복원율이 100%로 유지되어 효과적인 복구 성능을 입증하였다.
-
Jinwook Kim;Minjae Kim;Yein Kim;Seokju Kwon;Juyeong Jeong;Kyungroul Lee 153
디지털 시대에서 인공지능은 인간이 할 수 있는 글 작성, 그림 그리기와 같은 다양한 예술 분야에서 창작 활동을 위하여 활용되고 있다. 이러한 인공지능 기술을 생성형 AI라 불리며, 생성형 AI 기술 중에는 실제 데이터와 유사한 가짜 데이터를 생성하는 GAN 기술을 포함한다. GAN은 생성자와 판별자가 서로 경쟁하면서 데이터를 생성하고 구분하는 동작을 반복하며, 이를 통하여 실제와 매우 유사한 특징을 가지는 가짜 데이터를 생성한다. 이에 따라, GAN 모델의 키보드 데이터 보호의 활용 가능성을 검증하기 위하여, 다양한 GAN 모델을 기반으로, 2차원 데이터를 생성하고, 생성된 데이터의 성능을 분석하였다. 분석 결과, Random Forest 모델과 Gradient Boosting 모델에서 WGAN-GP 모델의 성능이 우수하지 않은 것으로 분석되었으며, CTGAN 모델은 다른 모델에 비하여 성능이 우수한 것으로 나타났다. 또한, 학습 횟수를 증가할 경우에는 Copula GAN의 성능이 가장 우수한 것으로 나타났다. 본 논문의 결과는 다양한 GAN 모델의 성능평가와 다양한 데이터로의 활용을 위하여 활용될 수 있을 것으로 사료된다. -
스마트닉은 고성능 네트워크 처리를 가능케 하는 차세대 네트워크 인터페이스로, 클라우드 및 데이터센터 환경에서 그 활용도가 빠르게 증가하고 있다. 본 논문에서는 NVIDIA의 BlueField-3 스마트닉을 활용하여, 컨테이너 기반 NFV(Network Function Virtualization) 환경을 구성하는 방법론을 제시한다. 특히 SF(Scalable Function) 및 VF(Virtual Function)를 이용한 인터페이스 구성과, 이를 Docker 컨테이너와 연동하는 방식을 중심으로 논의하였다.
-
Seo-Jun Lee;Hyeon-Ji Jang;Ju-Eon Choi;Dong-Hyun Yu 161
기존 이미지 보안 방식은 낮은 접근 편의성와 키 관리의 불편함으로 인해 활용에 제약이 있다. 본 논문에서는 이러한 한계를 극복하고, 보안성과 실용성을 모두 고려한 이미지 보안 시스템 Encra를 제안한다. 본 시스템은 사용자가 선택한 이미지 영역을 AES로 암호화하고, JPEG 포맷을 그대로 유지하여 암호화 이후에도 이미지 열람이 가능하다. AES 키는 수신자의 이메일 주소 기반으로 IBE 방식으로 보호되며, 별도의 복잡한 키 관리 없이 복호화 권한을 설정할 수 있다. -
본 논문은 Kyber 알고리즘의 타이밍 기반 부채널 공격 취약점을 분석하고, 이를 완화하기 위해 Secure World 내에서 SIMD 병렬 처리를 적용한 방어 기법을 제안한다. 제안 기법은 민감한 t 값에 따른 연산 시간의 편차를 기존 Kyber 대비 약 17.93% 더 적은 표준편차가 측정되어 타이밍 정보 유출을 어렵게 만들며, Raspberry pi 3B 환경에서 약 7.18%의 성능 향상을 확인하였다.
-
IT 기술의 발전으로 소프트웨어의 고도화가 진행되면서 잠재적인 취약점이나 버그를 찾아 내는 테스트가 중요한 부분을 차지하고 있다. 그러나 점점 복잡해진 소프트웨어는 전통적인 퍼징으로 취약점을 찾기 위한 깊은 탐색을 하지 못하는 어려움을 겪고 있다. 해당 문제를 해결하기 위해서 퍼징 테스트에 인공지능을 접목시키는 연구가 활발히 이루어 지고 있다. 본 논문에서는 인공지능 기반 퍼징 기법들을 분석하고, 인공지능 기반 퍼징의 한계점과 향후 연구 방향성을 살펴본다.
-
본 연구는 내부자의 정보유출 행위를 통제하기 위한 포렌식 기반 중앙 집중형 분석 프레임워크를 제안한다. 관리자 권한을 중심으로 기밀문서 열람 감지, 외부 반출 차단, USB 인증, 커버업 탐지, IP 접속 모니터링, 클립보드 키워드 감지 등 여섯 가지 기능을 통합해 정보 흐름 전체를 기록·통제할 수 있도록 설계하였다. 이를 통해 본 프레임워크는 실시간 대응과 조직 맞춤형 보안 정책 적용을 지원하며, 정보유출 예방과 사후 책임 추적 효과를 기대할 수 있다.
-
Nayeon Kim;Yunna Kim;Yeeun Min;Hyewon Jang;Youngjong Kim 171
기존 협업 플랫폼의 전통적인 RBAC 및 ABAC 모델의 한계를 극복하고자, 태그를 통한 직관적 권한 부여 방식을 제안한다. 관계 속성을 기반으로 권한을 판단하는 직관적이고 유연한 접근 제어 구조를 설계했으며, ABAC와 ReBAC의 장점을 결합한 모델을 공유 블로그 협업 환경에 적용했다. 이를 통해 사용자 주도의 자연스러운 협업과 실시간 권한 관리를 가능하게 한다. -
A Cloud-Based Method for Digital Content Piracy Determination and Transformation Type Identification최근 영상 콘텐츠 플랫폼 산업은 코로나 19(Convid-19)로 인한 비대면 소비 환경 변화에 힘입어 영화, 드라마, 방송프로그램 등이 인터넷망을 기반으로 송출되는 OTT 중심의 시대로 발전하고 있다. 이에 따른 스트리밍 서비스 확산은 다양한 저작권 보호 문제를 야기하고 있으며, 특히 콘텐츠 불법 복제 문제는 온라인 콘텐츠 서비스 제공에 있어 심각한 문제로 대두되고 있다. 이에 본 논문에서 제안하는 클라우드 기반 디지털 콘텐츠 불법 복제 및 변형 유형 판별 방법을 통해 불법 복제 판별 정확도 및 저작권 관리의 효율성을 높이고자 한다.
-
디바이스 드라이버는 OS 보안의 핵심 요소로, 커널 수준에서 실행되며 중요한 공격 표면을 형성하지만 테스트가 어렵다. 본 논문은 세 가지 대표적인 연구를 비교하여, 동적 프로빙과 다양한 I/O 인터페이스를 아우르는 디바이스 드라이버 fuzzing 기법의 최신 동향을 분석한다.
-
본 논문은 자율운항선박의 충돌 회피 AI 시스템을 대상으로, 분할 학습 구조에서 발생할 수 있는 Model Inversion 공격 시나리오를 설계하였다. 공격자는 피처 벡터를 탈취해 환경 정보를 복원하고, 이를 바탕으로 적대적 입력이나 데이터 오염과 같은 2차 공격을 수행할 수 있다. 특히 이러한 공격은 정상 추론처럼 위장되어 기존 침입 탐지 체계로는 탐지하기 어렵다. 본 연구는 위협 구조를 트리 형태로 정리하고, 정량적 평가 및 방어 체계 구축을 위한 기반을 제시한다.
-
Jee-Eun Park;Hyun-Sol Mun;Yeon-Hee Kim;Jong-Kil Kim 182
본 논문은 Accountable Ring Signature(ARS) 프로토콜의 기존 Python 구현을 Go 언어로 전환하여 성능을 향상하고 실제 서비스 환경에서의 적용 가능성을 평가하였다. 실험 결과, Go 기반 구현은 전체 실행 시간에서 약 3.6 배의 성능 향상을 보였으며, 정적 타입 기반 구조와 명시적 연산 구현을 통해 유지보수성과 확장성 또한 개선되었다. 이를 통해 Go 언어가 고성능 암호 프로토콜 구현에 효과적이며 ARS 의 실용적 적용 가능성을 높이는 데 기여할 수 있음을 확인하였다. -
The lack of diverse and adequate datasets for the detection of IoT malware is a significant challenge, hindering the development of effective malware detection models. This research work introduces the use of CodeBert, a pre-trained transformer to generate synthetic IoT malware variants. In this paper, with a goal of improving the accuracy of vulnerability detection, optimise detection time in IoT security - we compared the synthetic malware samples generated from CodeBert, to real-world IoT malware using two convolutional neural networks, one trained and assessed on the raw real-world IoT-23 Dataset and the second trained and evaluated on the synthetic dataset. The comparative performance evaluation showed that CNN2, achieved competitive results across all classification metrics when compared to CNN1. The 1st CNN achieved an accuracy of 93% while the 2nd had an accuracy of 91%.
-
본 논문은 보안적 취약점을 찾는 기능인 Fuzzing 이 가진 문제점 중에서 소프트웨어 기반 커버리지 기반 Fuzzing 이 지닌 문제점인 속도 및 오버헤드의 문제의 원인이 무엇인지 살펴보고 이에 대한 하드웨어 기반 Fuzzing 을 통한 각각의 해결 접근 방법이 무엇이 있는지 각 하드웨어 해결책의 차이점이 무엇인지 또한 공통적으로 가지고 있는 남아있는 문제점이 무엇이며 이를 해결하기 위한 추후 발전 방향성은 어떤 방향성으로 나아가야 하는지에 대해 언급한다.
-
클라우드 네이티브 기술은 높은 민첩성과 확장성을 기반으로 다양한 산업 분야에서 ᄈᆞ르게 도입되고 있다. 컨테이너, 오케스트레이션, 마이크로서비스, 서버리스 등으로 구성된 이 환경은 효율적인 서비스 운영을 가능하게 하지만 그만큼 보안위협도 다양하고 복잡해진다. 본 논문에서는 클라우드 네이티브 환경에서 발생 가능한 보안 위협을 컨테이너, 오케스트레이션, 네트워크, 서비스 간 통신, 서버리스, 공급망 보안, 클라우드 인프라 등의 범주로 구분하고 이에 대한 실용적인 대응 방안을 제시한다. 이를 통해 클라우드 네이티브 환경에서의 보안성 강화를 위한 방향성을 제안한다.
-
전기차 충전 인프라는 기존 내연 기관의 충전 인프라와 달리 차량과 충전소 간의 실시간 네트워크 연결을 기반으로 구성된다. 이를 통해 사용자 편의성이 향상되었으나, 네트워크 연결을 악용한 해킹, 데이터 탈취, 시스템 조작 등으로 인해 보안 위협 또한 증가하고 있다. 실제로 전기차 충전 인프라를 대상으로 한 다양한 보안 사고가 보고되고 있으며, 이는 시스템의 안전성과 신뢰성 확보에 대한 문제로 제기되고 있다. 이러한 문제를 해결하기 위해 발생 빈도가 높은 주요 취약점을 중심으로 그 원인을 분석하고, 이를 통해 향후 보안 사고를 예방하고 피해를 최소화할 수 있는 대응 방안 도출이 필요하다. 이에 따라, 본 논문에서는 전기차 충전 인프라에서 발생한 보안 사고사례와 취약점의 발생구조 및 원인을 분석하고자 한다.
-
Khadka Namrata;Lelisa Adeba Jilcha;Deuk-Hun Kim;Jin Kwak 200
The Vehicle-to-Grid (V2G) paradigm facilitates bi-directional energy and data exchange between Electric Vehicles (EVs) and the Smart Grid, enhancing power distribution efficiency and dynamic grid interaction. However, this open communication framework presents authentication-related security risks, particularly impersonation, Man-in-the-Middle (MITM), and replay attacks. This paper offers a focused analysis of these vulnerabilities by reviewing typical attack models and evaluating how current authentication protocols respond to them. Special attention is given to lightweight, certificate-based mutual authentication mechanisms employing Transport Layer Security (TLS) and Public Key Infrastructure (PKI). Through step-wise examination, the paper assesses the strength and limitations of these strategies in practical V2G environments, highlighting deployment challenges and security considerations. -
보안 취약점(CVE)에 대한 신속하고 정량적인 대응은 지속적인 과제이다. 특히 취약점이 공개된 이후 실제 공격이 발생하기까지의 시간이 빠르게 단축되고 있음에도 불구하고, 기존의 취약점 심각도 평가 방식(CVSS, Common Vulnerability Scoring System)과 대응정책(Vulnerability Embargo 설정)은 여전히 수작업 중심의 정적 프로세스를 기반으로 운영되고 있다. 본 연구는 신규 취약점 접수 시 해당 취약점의 설명(description)을 기반으로 CVSS Metrics 자동예측을 위한 두 가지 사전학습 모델을 비교 분석하였다. 또한 공격 가능성을 반영한 최소 및 최대 Vulnerability Embargo 기간을 산정하는 자동화된 실무적 모델을 제안한다.
-
동형암호는 암호화된 상태에서도 연산을 수행할 수 있는 암호이다. 양자컴퓨터 시대가 눈앞에 도래한 지금 양자컴퓨터에도 안전한 격자 문제에 기반을 둔 동형암호가 적용될 수 있는 분야는 무궁무진하다. 특히 최근 AI 의 발전에 따라 프라이버시 문제가 더욱 쟁점이 되고 있는데, 이를 해결하기 위해 등장한 프라이버시 보존 머신 러닝 기술 중 대표적인 것이 동형암호를 이용해 CNN(Convolution Nueral Network)의 추론을 구현하는 것이다. 이 논문에서는 CryptoNets 를 시작으로 HE-CNN 기술의 발전 흐름에 대해 소개하고, FPGA 등 하드웨어 가속 기술을 바탕으로 기존에 적용된 설계 프로세스를 개선한 새로운 디자인 프로세스를 제안한다. 특히 동형암호의 level 변화(연산 횟수 판단)를 고려한 유연성 있는 설계를 위해 다양한 병렬성 파라미터를 도입하고, DSE 로 자원을 최적 분배함으로써 기존보다 더 빠르고 자원 효율적인 가속기를 구현하는 방법을 탐구한다.
-
외환당국의 외환시장 구조 개선 정책으로 해외 금융기관의 시장 참여가 확대되고 트레이딩 패러다임이 FIX API 기반의 시스템 체결로 전환됨에 따라, FIX 프로토콜의 보안 취약점이 새로운 리스크로 부상하고 있다. 기존 침입탐지 시스템의 규칙 기반 접근법은 이러한 신규 위협을 탐지하는 데 한계가 있으므로, 머신러닝 등 인공지능 기법을 활용한 지능형 IDS 도입이 요구된다. 본 연구에서는 FIX 메시지 시퀀스로부터 거래 건수 및 상태 값 등의 특징을 추출하여 시계열 딥러닝 모델(LSTM)로 학습함으로써 이상 거래 행위를 탐지하는 IDS 모델을 제안한다. 제안된 시스템은 정상적인 거래 흐름과 어긋나는 비정상 패턴을 실시간으로 식별함으로써 FIX API 트레이딩 모델의 보안 취약점을 개선할 것으로 기대된다.
-
반도체 집적 기술과 무선통신 기술의 발전으로 IoT (Internet of Things) 디바이스가 전송하는 데이터의 용량과 속도가 증가하고 있다. IoT 디바이스는 무선 네트워크 환경에서 데이터를 송수신하므로 한정적인 네트워크 채널을 효율적으로 활용하는 것이 중요하다. 또한 IoT 디바이스는 경량화된 배터리를 사용함으로 전력을 효율적으로 사용하는 것 또한 중요하다. 기존 연구들은 IoT 트래픽을 클러스터링하여 네트워크 성능을 최적화하고자 하였으나, 제안기법으로 인한 추가적인 전력 소모에 대해서 고려하지 않았다. 따라서 본 논문에서는 IoT 트래픽을 채널 점유율에 따라 분류하여 클러스터링하는 A-MPDU (Aggregated MAC Protocol Data Unit) 기반의 데이터 집계 기법을 제안한다. 실험 결과에 따르면, 제안하는 방법은 종래모델 대비 처리량은 평균 799.73%, 효율성은 15.68 배 증가했으며 전력 소모량은 최대 평균 91.45% 개선되었다.
-
최근 대규모 언어 모델(LLM) 기반의 AI 코드 생성 도구는 소프트웨어 개발 생산성을 크게 향상시켰지만, 학습 데이터의 시점 한계로 인해 최신 보안 취약점이 해결되지 않은 과거 버전의 라이브러리를 추천하는 문제가 있다. 본 논문에서는 최신 CVE 데이터베이스를 활용하는 RAG 시스템을 통해 코드 생성 전에 보안 템플릿을 생성하는 "CVE-RAG" 프레임워크를 제안한다. 이 프레임워크는 단순히 "최신 버전 사용" 지시보다 각 라이브러리에 대한 구체적인 취약점 정보를 기반으로 맞춤형 보안 가이드라인을 제공한다. 실험 결과, 제안된 프레임워크를 통해 생성된 코드는 템플릿 미적용 시에 비해 의존성 취약점이 100% 감소하였으며, 안전한 라이브러리 버전 사용률이 0%에서 100%로 향상되었다.
-
최근 악성코드는 단순한 시스템 장애를 넘어서, 실행 파일 내에 포함된 민감 정보를 탈취하여 외부로 유출하는 등 고도화되고 있다. 악성코드를 탐지하기 위해 바이너리 데이터를 그레이스케일 이미지로 변환하고, CNN(합성곱 신경망)을 이용해 시각적 패턴을 학습하는 기법이 활용되어 왔다. 그러나 이러한 중앙집중형 학습 방식은 대량의 악성코드 데이터를 한 곳으로 모으는 과정에서 개인 정보 유출 및 데이터 사일로 문제를 초래할 위험이 있다. 본 연구에서는 악성코드 실행 파일을 이미지로 변환한 후, 각 클라이언트에서 로컬로 CNN 모델을 학습하고, 학습된 모델 파라미터만을 중앙 서버에 전송하여 전역 모델을 구축하는 연합학습 프레임워크를 제안한다. 이러한 방법을 이용하여 민감한 원본 데이터를 외부로 전송하지 않고, 프라이버시를 효과적으로 보호하면서도 다양한 출처의 데이터를 활용해 높은 탐지 성능과 모델 일반화 능력을 달성할 수 있을 것이다.
-
Su-bin Lee;Da-hyung Kim;Jeong-hwa Ryu;Yi-seul Choi;Seong-min Kim 226
오늘날의 대표적인 익명 네트워크인 토르(Tor)는 자원봉사자의 릴레이에 기반해 운영되며, 이로 인해 악의적 릴레이를 통한 사용자 대상의 능동적(active) 공격 사례가 다수 존재한다. 본 논문은 이러한 공격의 특성을 분석하고, 악성 행위에 따른 릴레이의 특징을 시나리오 기반으로 구분하여 살펴본다. 특히, C&C 서버와의 통신 여부, 대역폭 허위 보고와 같은 행위를 중심으로 분석을 진행하였으며, 연구 결과는 향후 악성 릴레이 탐지에 활용될 수 있을 것으로 기대한다. -
최근 종단간 암호화 기술이 널리 적용됨에 따라, 이를 악용한 보안 위협 또한 증가하고 있다. 종래의 심층 패킷 분석(Deep Packet Inspection, DPI) 방식은 페이로드를 복호화하여 트래픽을 분석하므로 종단간 암호화 환경에 적용하기 어렵다. 또한, 동형암호는 연산 지연이 크기 때문에 실시간 탐지가 요구되는 환경에서는 실용적이지 않다. 본 논문에서는 복호화 없이 암호화된 트래픽을 효율적으로 탐지할 수 있는 퍼지 해시 기반 침입 탐지 시스템(Fuzzy Hash-based Intrusion Detection System, FH)을 제안한다. FH는 페이로드에서 퍼지 해시 값을 생성하고, 이를 별도의 제어 프레임으로 병렬 전송한 뒤, 머신러닝 탐지 모델을 통해 악성 여부를 판별한다. 실험 결과에 따르면, FH는 DPI 대비 전송 지연을 최대 11.41% 감소시키고, 스루풋을 12.88% 향상시켰다. 또한, 탐지 정확도를 유지하면서도 학습 시간과 메모리 사용량을 각각 최대 90.44%, 91.86% 개선하였다.
-
ROS (Robot Operating System)는 로봇 소프트웨어의 효율적인 개발과 확장을 가능하게 하며, 많은 산업 및 연구 현장에서 표준 인터페이스로 자리잡고 있다. 최근에는 마이크로컨트롤러 (MCU)에도 적용 가능한 micro-ROS가 등장함에 따라 임베디드 환경에서도 널리 사용되고 있다. 그러나 micro-ROS의 초경량 통신 계층인 XRCE-DDS는 암호화를 포함한 DDS Security 기능을 완전히 지원하지 못해 잠재적인 보안 취약점이 존재한다. 따라서 본 논문에서는 ROS 1 및 ROS 2에서 수행된 대표적인 신뢰성 및 이상 탐지 연구들을 분석하고, 그 결과를 micro-ROS 환경에 이식했을 때의 적용 가능성과 한계를 평가한다. 이러한 접근은 micro-ROS 기반 로봇 시스템에서의 신뢰성과 안전성을 높이는 데에 기여할 것이며, 다양한 산업 분야에서의 응용 가능성 확대에 핵심적인 역할을 할 것으로 기대된다.
-
GUI 기반 애플리케이션은 다양한 입력 경로와 복잡한 상태 전이로 인해, 예상치 못한 입력에 대한 취약점이 발생할 가능성이 높다. 본 논문에서는 특별한 자동화 도구 없이, 수동으로 테스트를 수행하여 취약점을 탐지한 사례를 소개한다. 대표적인 오픈소스 이미지 처리 도구인 ImageMagick 을 대상으로 다양한 파일 포맷을 직접 테스트하는 과정에서 힙 오버플로우(Heap Overflow) 취약점을 발견하였다. 이 사례를 통해 수동 테스트의 중요성과 한계, 그리고 향후 GUI 애플리케이션 테스트의 개선 방향을 논의한다.
-
Hyeonmoon Kim;Kyeong-Hwa Nam;Yu-Jung Choi;Byoungjoon Min 237
최근 Linux 커널의 Netfilter 프레임워크에서 발생한 취약점들 중, Use-After-Free(UAF) 및 Double Free를 유발하는 사례가 꾸준히 보고되고 있으며, 이는 메모리 조작을 통한 권한 상승 공격으로 이어질 수 있어 보안상 큰 위협이 되고 있다. 본 논문에서는 이러한 사례 중 하나인 CVE-2024-1086을 분석 대상으로 삼고, 해당 취약점이 nf_tables 구성 요소에서 skb 구조체를 대상으로 발생한다는 점에 주목하였다. 이를 바탕으로 취약점의 구조와 보안 위협을 분석하고, 이를 탐지 및 완화하기 위한 대응 방안으로 eBPF(extended BPF) 기반의 모니터링 프레임워크를 제안한다. -
쿠버네티스 기반 마이크로서비스 아키텍처는 유연성, 확장성, 다양한 사용 사례를 제공하는최신 클라우드 네이티브 환경의 핵심이다. 클라우드 환경에서 빈번한 대규모의 복잡한 배포를 고려할 때 잠재적인 위협을 탐지하려면 감사가 매우 중요하다. 이러한 요구를 해결하기 위해 eBPF 기반의 다양한 보안 도구(ESST)가 개발되었으며, eBPF를 활용하여 쿠버네티스 환경의 프로세스 및 네트워크 활동을 모니터링하고 의심스러운 이벤트를 기록하며 보안 정책을 시행할 수 있다. 그러나 관리자는 종합적인 비교 분석이 부족하여 가장 적합한 ESST를 선택하는 데 어려움을 겪는 경우가 많다. 따라서 이 논문에서는 내부 아키텍처, 정책 적용 범위, 전반적인 성능에 초점을 맞춰 널리 사용되는 ESST인 KubeArmor, Tetragon, Falco, Tracee에 대한 심층적인 평가를 진행한다.
-
Sanitizer 는 메모리 오류, 타입 불일치, 초기화되지 않은 값 사용 등 취약점을 탐지하는 동적 분석 도구로, 소프트웨어 테스트에 널리 활용된다. Address Sanitizer 와 같은 메타데이터 기반 도구는 높은 탐지율을 보이지만, 메모리 사용과 실행 시간 측면에서 한계가 있다. 이를 보완하기 위해 최근에는 poison value 를 활용한 경량 sanitizer 가 제안되고 있다. 논문은 이러한 기법들을 정리하고, 탐지 정확도, 오탐률, 오버헤드 관점에서의 특성과 실용 가능성을 고찰한다.
-
Geonmin Kim;Eunseong Lee;Minsoo Jeung;Dayoung Oh;Seojun Lee;Hyeonji Jang;Kwanghoon Choi;Kyungbaek Kim 245
현대 소프트웨어 개발 환경은 하나의 코드 스니펫이 다수의 보안 취약점에 동시에 노출되는 위협에 직면해 있다. 본 연구는 이러한 다중 취약점 환경을 반영한 멀티라벨 분류 전략을 기반으로, 사전학습 언어 모델인 CodeBERT의 취약점 인식 성능을 정량적으로 분석한다. SARD 데이터셋을 활용하여 6가지 CWE 유형에 대해 CodeBERT의 정밀도, 재현율, Threshold 변화에 따른 탐지 트레이드오프 등을 고찰한다. 또한, CWE 취약점 유형에 따른 탐지 성능 차이를 논한다. -
Geonmin Kim;Eunseong Lee;Minsoo Jeung;Dayoung Oh;Seojun Lee;Hyeonji Jang;Kwanghoon Choi;Kyungbaek Kim 247
딥러닝 기반의 코드 취약점 탐지 모델은 최근 소프트웨어 보안 자동화의 핵심으로 부상하였다. 그러나 이는 사전학습 언어 모델을 기반으로 하여 방대한 파라미터 수와 미세 조정 과정에서 자원 소모가 많다는 한계를 지닌다. 이에 본 연구는 CodeBERT와 LoRA를 결합하여 경량화된 멀티라벨 취약점 탐지 모델을 제안한다. 여러 CWE 유형에 대하여 LoRA가 제공하는 학습 효율성과 일반화 가능성을 실증하여 학습 파라미터 수와 자원 소모를 대폭 감소시키는 경량화 기법을 제안한다. -
Ki-Bong Kang;Yun-Seong Hwang;Jun-Seung You;Yun-Heung Paek 249
신뢰 실행 환경(Trusted Execution Environments, TEE) 기술은 Intel SGX, AMD SEV, ARM CCA 등을 중심으로 발전하여, 특권 권한을 가진 공격자로부터 민감한 데이터와 코드를 보호하기 위해 널리 사용되고 있다. 그러나 최근 연구들은 TEE 에서 사용되는 결정론적 메모리 암호화 방식이 Ciphertext Side-Channel Attack 이라는 새로운 유형의 취약점을 초래할 수 있음을 보여주었다. 이러한 공격은 암호화된 메모리의 변화를 관찰함으로써 메모리 보호를 직접적으로 침해하지 않고도 민감한 정보를 추론할 수 있다. 본 연구는 Ciphertext Side-Channel Attack 의 근본적인 원리를 체계적으로 분석하고, TEE 환경에서 이를 완화하기 위해 제안된 최신 방어 기법 동향을 조사하였다. 특히, Enclave Management Task 의 물리적 분리, 성능과 보안성을 균형 있게 확보하는 Hybrid Memory Encryption 기법, 그리고 암호문 패턴 예측을 방지하기 위한 Interleaving 기반 데이터 다양화 전략을 중심으로 하드웨어 기반 주요 대응 방식을 심층적으로 분석하였다. 방어 전략별 강점과 한계를 비교 분석한 결과, 현재의 대응 기법들은 각각 특정 조건에서 효과적이나 모든 공격 시나리오를 포괄하기에는 한계가 있음을 확인하였다. 이에 따라, 지속 가능한 TEE 보안을 위해서는 하드웨어와 소프트웨어의 긴밀한 협력을 기반으로 한 Cross-Layer Co-Design 접근, 세분화된 메모리 은닉화 기법과 비결정론적 암호화 모델이 필수적임을 제안한다. -
본 논문에서는 IoT 및 엣지 디바이스를 위한 ARM TrustZone 기반 보안 기법인 TEECheck, TrustedGateway, TeeFilter를 조사하였다. 이 기법들은 각각 차량 내 통신, 게이트웨이 라우터, IoT 네트워크 필터링이라는 다른 도메인에서 하드웨어 격리를 통해 운영체제가 손상되더라도 네트워크보안을 유지한다.
-
Ju-Hyeong Seo;Ga-Young Kim;Tae-Yun Kim;Gi-Tae Bae;Chan-Hyung Kim;IbrahiMova-Naila;Jong-Hee Youn 256
본 연구는 최근 인터넷 환경에서 암호화 프로토콜의 사용 증가로 기존 방식의 네트워크 트래픽 분류가 제한됨에 따라, 이를 해결하기 위한 오토인코더 기반 트래픽 분류 기법을 분석하였다. Flow Spectrum 및 AMAE 기법은 높은 정확도를 보였으나, 스펙트럼 중첩 현상 및 데이터 편향 문제가 존재했다. Masked AutoEncoder를 적용한 YaTC는 비라벨 데이터를 이용한 사전학습을 통해 정확도와 실용성을 개선하였으나, MFR 형식의 일반화 가능성에 대해 추가 검증이 필요하다. -
Tae-Yun Kim;Gi-Tae Bae;Ga-Young Kim;Ju-hyeong Seo;Chan-hyung Kim;Ibrahimova Naila;Jong-Hee Youn 258
인터넷 사용의 급증과 더불어 개인정보 보호 및 보안 강화의 중요성으로 인해 암호화 트래픽이 급증하였다. 이러한 암호화 트래픽의 증가로 악성 행위가 은폐되고 보안 솔루션의 가시성 또한 저하되는 문제점들이 야기되고 있다. 이러한 연유로 암호화 트래픽을 분류하는 연구들이 진행되고 있는데 최근 AI 기술의 발전으로 암호화 트래픽 분류 연구에 AI 기술 많이 연구되고 있다. 그 중 MAE(Masked Auto-Encoder)기반 모델이 좋은 성능으로 주목받고 있는데 MAE 기반 모델의 학습 연산은 상당한 비용과 시간이 필요한 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위한 방안으로 어텐션 메커니즘의 경량화 기법에 대해서 고찰하고자 한다. -
Jung-Hyun Woo;Sung-Min Jeon;Muhammad Muneeb;Kwang-Man Ko 260
본 연구는 의료기기 사이버보안 평가의 체계적 수행을 지원하기 위한 방안으로, 식품의약품안전처(MFDS)의 「의료기기 사이버보안 허가·심사 가이드라인(2024)」을 기반으로 한 체크리스트 기반 보안 사전검증 시뮬레이터의 설계 프레임워크를 제안한다. 제안된 시뮬레이터는 웹 기반 구조를 따르며, 보안 요구사항에 대한 체크리스트 응답을 시작으로 CWE 기반 위험 시나리오 매핑, SBOM 기반 정량적 취약점 분석, 자동 보고서 생성을 하나의 흐름으로 통합한다. 또한 본 시스템은 FastAPI, React, PostgreSQL 등 오픈소스 기술을 활용하여 아키텍처를 설계하였고, 외부 보안 정보 연동을 위해 NVD, GitHub Advisory, MITRE CWE DB API의 통합 방안을 포함한다. 본 연구는 이를 통해 의료기기 보안 내재화를 위한 개발 초기단계 자가진단 도구의 필요성을 충족하고, 향후 실제 구현과 적용 사례 연구를 위한 기초 설계를 제공하는 데 목적이 있다. -
Chan-hyung Kim;Ibrahimova Naila;Tae-Yun Kim;Ga-Young Kim;Ju-hyeong Seo;Gi-Tae Bae;Jong-Hee Youn 264
암호화된 트래픽의 증가로 인해 기존 페이로드 기반 분석 기법의 활용이 어려워지면서, 복호화 없이도 효과적으로 트래픽을 분류할 수 있는 새로운 특징 추출 및 분류 기법이 요구되고 있다. 본 연구에서는 기존 FlowSpectrum 기법이 스펙트럼 라인 간의 간격만을 기반으로 유사도를 계산함에 따라 라인 간 겹침 시 분류 정확도가 저하되는 문제를 해결하고자, 평균값 비교 과정을 추가한 Mean FlowSpectrum 기법을 제안한다. 제안된 방법은 각 트래픽의 스펙트럼 평균값을 활용하여 전체적인 분포의 차이를 고려함으로써 분류의 정밀도를 높인다. ISCX-VPN2016 데이터셋을 기반으로진행된 실험에서는, 기존 FlowSpectrum 대비 전반적인 정확도에서 약 5%p 향상된 성능을 보였으며, 특히 스트리밍, 파일 전송 등 일부 레이블에서 f1-score 기준 0.1 이상 향상된 결과를 확인할 수 있었다. 이는 평균값 기반의 보조 지표가 암호화된 트래픽 분류 성능 향상에 효과적으로 기여할 수 있음을 시사한다. -
퍼징(fuzzing) 기술은 소프트웨어의 취약점을 자동으로 탐지하는 데 있어 강력한 도구로 자리잡았지만, 퍼징으로 발견된 크래시(crash)의 근본 원인(root cause)을 규명하는 과정은 여전히 수작업에 크게 의존하고 있다. 이를 해결하기 위해 퍼징 기반 Root Cause Analysis(RCA)를 자동화하려는 다양한 연구들이 제안되고 있다. 본 논문에서는 대표적인 퍼징 기반 RCA 기법인 AURORA, RACING, BENZENE을 소개한 다음, 향후 연구 방향을 제안한다. 본 연구는 퍼징 기반 RCA 기술의 발전 현황을 정리하고, 완전 자동화된 취약점 근본 원인 분석으로 나아가기 위한 기반을 제공하고자 한다.
-
온디바이스(On-device) 딥러닝은 사용자의 프라이버시를 보호할 수 있다는 장점으로 인해 점차 주목받고 있다. 그러나 이러한 접근은 딥러닝 모델이 사용자 디바이스에 전달됨에 따라, 오히려 모델 자체의 프라이버시가 취약해지는 문제를 야기한다. 이에 때라 최근 연구들은 신뢰실행환경(Trusted Execution Environment, TEE)을 활용하여 딥러닝 모델의 프라이버시를 보호하고자 시도하고 있다. 그러나 기존 TEE 기반 딥러닝 모델 보호 기법들이 전제하는 TEE의 위협 모델은 모델 프라이버시를 충분히 보장하지 못하는 한계를 가진다. 본 논문에서는 기존의 TEE 위협 모델을 분석하고, 이를 바탕으로 기존 보호 기법들이 방어하지 못하는 공격 시나리오들을 제시한다. 또한, 이러한 공격에 대응하기 위한 기본적인 방안과 그 한계점에 대해 논의한다.
-
Application processors (APs) are increasingly used in mixed-criticality systems (MCS), where components with varying safety and real-time requirements share a platform. In MCS like automotive systems, real-time communication is essential for safety. While APs often handle non-critical tasks, they still rely on real-time data and peripherals. However, their multi-processing nature and often external network connectivity expose them to attacks, which can compromise real-time channels or make the APs a source of malicious data. This paper explores the possibility and challenges of securing real-time communication peripheral access on application processors in MCS environments.
-
양자 컴퓨터 시스템에서도 기존 컴퓨터 시스템처럼 보안성을 보장하는 암호체계를 양자내성암호(PQC, Post Quantum Cryptography)라 한다. NIST 에서 표준화로 선정된 네 가지 알고리즘 중 SPHINCS+ 알고리즘은 해시 연산을 반복적으로 수행하는 해시기반 알고리즘이다. 이에 따라 해시기반 알고리즘에서 반복적으로 사용되며 많은 연산 시간을 구성하는 해시 연산을 효과적으로 구현하려는 연구들이 진행되고 있으며, 그 중에는 RISC-V 를 통한 하드웨어/소프트웨어 통합 설계 연구 그리고 FPGA 혹은 ASIC 을 이용한 하드웨어 통합 모듈 가속 연구들이 있다. 본 논문에서는 해시기반 양자내성암호 알고리즘의 효과적인 하드웨어 설계를 위해 해시 연산 모듈러 가속 방법을 분석하고, 이를 하드웨어에서 효과적으로 구현한 기존 연구 사례를 분석한다. 이를 통해 해시 연산의 모듈러 가속 기법 연구를 위해 고려되는 설계면적 그리고 연산 성능 등의 수치를 높이는 과정에서 발생하는 트레이드 오프와 이를 효과적으로 극복하는 방법들을 소개한다.
-
본 연구는 생성형 인공지능 서비스의 개인정보 보호법 위반 사례를 분석하기 위해, 딥시크(DeepSeek)의 웹 서비스를 대상으로 기술적 접근을 수행하였다. 클라이언트-서버 간의 네트워크 트래픽 분석을 통해, 사용자 입력 정보와 시스템 로그가 사용자의 동의 없이 외부 서버로 전송되고 있음을 확인하였다.또한 개인정보 처리방침이 한국어로 제공되지 않았으며, 국외이전 및 제3자 제공 관련 고지와 동의절차가 누락되어 있었다. 이와 같은 사항은 「개인정보 보호법」 제28조의8, 제30조 및 개인정보 보호원칙에 위반되는 정황으로 판단된다. 본 연구는 딥시크 사례를 통해 생성형 인공지능 서비스에서 발생 가능한 개인정보 침해 유형을 실증적으로 제시하고, 이에 대응하기 위한 규제 개선 방향을 제안한다.
-
Seong-hun Kim;Jun-min Lee;Tae-hun Gong;Jeong-hee Kim;Byeong-uk Jo;Sobirova Ikboloy;Han-xu Yang;Sejin Park 287
본 논문은 미션 앱 내에서 Token 인증 방식의 효율성을 유지하면서 사용자 민감 정보 보호를 강화하기 위한 구조를 제안한다. 제안한 방식은 사용자의 생년월일과 같은 데이터를 Laplace 노이즈를 적용한 후 Token에 포함시키는 형태로 차분 프라이버시(DP)를 활용한다. 실제 부하 테스트를 통해 해당 구조가 보안성 측면에서는 약 95% 이상의 익명성 보장 효과를 보였으며 처리량과 응답시간 측면에서도 성능 저하가 거의 없음을 확인하였다. 본 논문은 개인정보 보호와 Token인증 효율성을 동시에 구현할 수 있는 가능성을 고찰한다. -
Chae-Yeon Lee;Seol Oh;Ah-Young Kim;Won Joo;Hyung-Jong Kim 289
최근 기업과 조직이 내부 데이터를 분석하거나 외부에 공유하는 사례가 증가하면서, 이에 따른 개인 정보 유출 및 프라이버시 침해 우려도 함께 커지고 있다. 특히 비정형 데이터에는 다양한 형태의 민감정보가 포함될 수 있어, 이를 효율적으로 탐지하고 처리할 수 있는 실용적 방안이 요구된다. 본 논문은 주민등록번호, 연락처 등 10가지 주요 민감정보를 정규표현식을 통해 탐지하고, 수동 입력을 통해 가명화 할 수 있는 포렌식 지원 도구를 설계·구현하였다. 이 도구는 개인정보 보호법을 준수하며, 대화 데이터를 사례로 하여 비정형 텍스트 환경에서의 적용 가능성과 효율성을 확인하였다. -
클라우드 기반 머신러닝에서 온디바이스 머신러닝(On-device ML)으로 패러다임이 이동함에 따라, 데이터 프라이버시뿐 아니라 모델 자체의 기밀성을 보호하는 모델 프라이버시 문제가 새롭게 부상하고 있다. 온디바이스 환경에서는 모델이 사용자 디바이스에 직접 배포되므로 공격자가 구조와 파라미터에 접근할 수 있는 화이트박스 위협이 발생하며, 이는 모델 도난, 역공학, 학습 데이터 유출 등 심각한 보안 위협으로 이어질 수 있다. 이에 대한 대응으로 최근 TEE(Trusted Execution Environment) 기반 추론 보호 기법들이 활발히 연구되고 있으며, 본 논문은 이를 전체 계층보호, 부분 계층 보호, 난독화 및 경량화 기반 보호로 분류하여 각각의 구조, 보안성, 성능 특성을 비교 분석하며 향후 신뢰 가능한 온디바이스 AI 시스템 구축을 위한 방향성을 제안한다.
-
Kevin Nam;Heonhui Jung;Seungjin Ha;Yunheung Paek 295
클라우드 기반 AI서비스들은 사용자의 프라이버시 유출 위험이 있다. 이에 다양한 기술들을 활용한 프라이버시 보존형 AI 서비스 기술들이 등장했다. 하지만 기존 연구 결과들을 살펴보면, 실제 클라우드 서비스 환경과는 다소 차이가 있다. 본 연구는 이런 비현실적인 가정들을 파악하고 실제 클라우드 서비스 환경에서 여러 프라이버시 보존형 AI 서비스들의 성능을 비교분석한 결과를 제시한다. -
NFT는 중앙화되어 있는 디지털 자산의 원본성과 진위성 증명을 블록체인 기술로 대체할 수 있는 혁신적인 방법으로 주목받고 있으나, NFT도 블록체인에 등록되기 전에 생성된 콘텐츠의 원본성과 진위성은 보장할 수 없다. 본 논문에서는 원본 콘텐츠 파일과 그에 대한 원본 증명 정보에 암호화 해시를 적용하여 실시간으로 NFT로 발행하고 추후 원본성과 진위성을 증명할 수 있는 방법을 제안한다. 또한 실시간으로 NFT 발행이 불가능할 경우 원본 콘텐츠 파일과 원본 증명 정보를 암호화하여 보관하였다가 나중에 NFT로 발행하여 원본성과 진위성을 증명할 수 있는 방법도 제안한다. 추가로, 발행된 NFT URL을 별도로 메모하지 않고 원본 콘텐츠 파일 자체만으로 NFT를 검색하여 원본을 증명할 수 있는 방법도 제안한다.
-
Sung-Min Jeon;Jung-Hyun Woo;Muhammad Muneeb;Kwang-Man Ko 304
본 논문은 블록체인 기반 분산신원인증(DID) 기술을 호텔 체크인 시스템에 적용함으로써, 비대면 환경에서도 신뢰성과 효율성을 동시에 확보할 수 있는 기술 구조를 제안한다. 제안된 시스템은 실시간 신원 인증, 스마트컨트랙트 기반의 체크인 자동화, 디지털 룸키 발급, 로컬 기반 AI 서비스 추천 등으로 구성되며, Hyperledger Fabric 블록체인을 활용하여 데이터의 무결성과 이력의 투명성을 보장한다. 특히, 민감 정보의 최소 수집, 탈중앙화 식별자 구조, 로컬 처리 방식 등을 통해 개인정보 보호를 고려한 기술 설계를 구현하였다. 본 연구는 시스템 구성요소 및 구현 방식을 중심으로 연구하고, 호텔 산업에서의 적용 가능성과 기대 효과를 제시한다. -
Soyeon Kim;Yujin Kim;Yurim Lee;Jinhyang Kim;Yeoeun Kim;Junghoon Lee 309
본 논문에서는 HAPI 오픈 소스를 기반으로 하여 FHIR 표준 의료정보 서버를 구축한다. HAPI 소프트웨어는 Java 언어로 웹 요청의 전달 및 인자의 파싱, 접근제어 정책의 구현, FHIR 자원의 객체 정의에 관련된 풍부한 라이브러리를 제공하고 있으며, 이를 활용하여 각 의료기관의 저장 시스템과 효율적으로 연동함은 물론 다양한 엔티티가 데이터 공유에 의한 협력이 가능하다. -
Jueun Jin;Sungyoon Jung;Hyukju Kwon;Chaeeun Oh;Junghoon Lee 311
본 논문에서는 Google Cloud Framework에서 저장되어 관련되는 FHIR 자원들을 조회, 검색, 생성하는 클라이언트를 개발한다. 구현된 응용은 RESTful API를 통해 클라우드 데이터에 접근하기 위해 파이썬의 request 라이브러리 함수를 호출하며, G-Cloud를 설치하여 세션 시작마다 구글 클라우드로부터 접근 키를 할당받는다. FHIR 기반의 의료 데이터는 JSON 형태를 가지며 클라우드 외부에서 각 필드의 중요도와 같은 부가적인 정보를 통해 목적에 맞는 응용을 개발할 수 있다. -
인공지능 기반 손동작 인식 시스템은 레벨별 위협 상황을 3단계로 나누어 자동으로 대응하는 시스템을 개발한다. 본 논문에서 개발한 구조요청시스템은 귀가 시 묻지마 범죄에 대응할 수 있는 효과적인 시스템으로 활용될 수 있다. 위협 상황에 따라 119, 가족, 지인에게 연락하고, 사이렌 및 경고음을 송출할 수 있다. 제안한 시스템을 통해 사회적 취약계층을 포함한 다양한 사용자가 위협상황에서 신속하게 도움을 받을 수 있고 효과적인 대응이 가능할 수 있다.
-
한의학에서 '한(寒)'증과 '열(熱)'증은 신체의 내부 기능 및 활성도의 균형을 설명하는 유용한 방법이다. 한열 변증을 파악하기 위해 현재 주로 한의사의 경험적 판단이나 설문 조사에 의존하는 방법이 사용되고 있다. 이 연구에서는 한증의 특징을 명확하게 구분하는 정량적인 지표를 개발하는 것을 목표로 한다. 설문지를 통해 69명의 한증 보유자와 31명의 비보유 집단을 구분하여 복부 기하 및 색상 특성과 통증 감지 시의 깊이와 압력을 통계 분석하여, 복부의 색상과 압통 반응과 같은 특정 변수들이 한증 보유자를 대조군과 구분하는 데 유의하게 작용함을 확인하였다. 앞으로 축적된 데이터는 정밀한 진단을 가능하게 하여 복진 장치의 발전에 기여할 것으로 기대된다.
-
Yong-Su Park;Gunhee-Ko;Jae-Hyun Lim;Jeong-Dong Kim;Taek Lee;Jung-Been Lee 318
본 연구에서는 복지 사각지대에 놓인 취약 계층이 익명으로 지원을 요청할 수 있는 기부 앱을 설계하고자 한다. 회원 관리 시스템을 갖춘 모바일 앱을 개발하여 기부 및 모금 게시판을 운영하고, Kakao Quick 및 배송 API를 활용한 비대면 물품 기부 기능을 구현하였다. 또한, 문서 진위 여부를 검증하기 위해 OCR과 Selenium을 활용한 취약 계층 인증 모듈을 개발하였다. 이를 통해 개인정보 노출 없이 효율적 지원이 가능하며, 부정 수급을 방지하고 기부 절차의 투명성을 강화할 수 있었다. -
SuMin Lee;DaGyeong Kwak;JunSeok Oh;JiSung Jung;YongHyun Kwon;YoungGyun Kim 320
최근 CRM 전략 중 세분화된 CRM 요소들의 통합을 돕는 AI 기반 고객 이탈 예측 모형의 중요성이 강조되고 있다. 본 연구에서는 LSTM 모델을 이용해 이를 구현하였고, 전통적 기법과의 성능 비교를 통해 우수성을 평가하였다. 이를 각 산업 분야에 적용한다면 마케팅 비용 절감 및 기업의 수익성 증대에 기여할 것으로 예상한다. -
Useong Choe;Hyoengoh Son;Taeyong Kim;Byeongseok Ryu;YongHyun Kwon;YoungGyun Kim 324
최근 투자 상품 선호도가 증가함과 동시에 투자 지식 부족으로 인한 채무자가 증가하고 있다. 따라서 본 연구는 시장 지표, 재무제표 및 거시 경제 지표 데이터를 활용하여 사전 지식 없이도 활용 가능한 강화학습 기반 주식 투자 전략 모델을 개발하는 것에 목표를 둔다. 2014년부터 2025년까지의 금융 및 재무 데이터 및 자산을 분석하고 미래 성장 가능성을 평가하는 CNN 기반 정책 신경망인 EIIE를 활용하여 포트폴리오 투자를 진행하였다. 실험 결과, 강화학습 기반 모델은 Buy and Hold 전략 대비 유의미한 수익률 개선을 보였다. 이를 통해 EIIE를 활용한 강화학습 모델이 주식 투자에 효과적으로 활용될 수 있음을 입증하였다. -
Gyeongmin Kim;Jaewon Kim;Jaehoon Seol;Yonghyun Kwon;YoungGyun Kim 328
GNSS/INS를 활용한 항법 시스템은 무인항공기의 위치 추정에 있어 매우 중요한 요소이다. 그러나 GNSS/INS 시스템은 두 센서의 상호보완 시스템이므로 하나의 센서에 오차가 발생할 시, 위치 좌표를 신뢰하기 어렵다. 따라서 GNSS/INS 항법 시스템 고장에도 독립적으로 위치 추정이 가능한 시스템이 필요하다. 본 논문은 이미지 데이터를 활용한 항법 시스템을 제안한다. 항공 이미지에서 Segmentation 모델로 건물과 도로를 검출한 뒤, 특징점 매칭 알고리즘을 적용하여 위치 좌표를 추정한다. 이는 무인 항공기의 GNSS 통신이 원활하지 않은 상황에서도 위치 추정을 가능케하며, Visual Navigation 시스템에 활용하여 무인 항공기의 자율 비행 성능 개선에 기여할 수 있다. -
Minji Kim;Sehun Park;Euisik Shin;Byeongseok Ryu;Yonghyun Kwon;YoungGyun Kim 332
기후 변화로 한라봉 재배 환경이 달라지면서 병해 발생 빈도와 심각성이 증가하고 있다. 그러나 기존 병해 판별 방식은 주관적 오류가 발생하기 쉽고, 시간이 많이 소요되어 효율적인 관리가 어렵다. 따라서, 보다 빠르고 정확한 병해 진단 자동화 시스템의 필요성이 커지고 있다. 본 연구에서는 딥러닝 모델과 OpenCV를 활용하여 한라봉 잎과 과실의 병징을 자동 감지하고, 확산 정도를 정량적으로 평가함으로써 농업 종사자의 신속한 대응을 지원하고 농가의 생산성과 상품 품질 향상에 기여하고자 한다. -
Minji Kim;Quwon Lee;Seongjae Lee;Byeongseok Ryu;YoungGyun Kim 336
본 연구에서는 한우 육질등급 평가의 신속성과 일관성을 향상하기 위해 Python과 OpenCV 기반의 자동화 알고리즘을 구현하였다. 전문가에 의해 이루어지는 기존의 주관적 평가 방식을 대체하여 근내지방도, 육색, 지방색, 조직감을 정량적으로 분석하고 최종 육질등급을 도출한다. 알고리즘은 이미지 전처리, 근내지방도 계산, 육질 및 지방부 대표색 분석, 조직감 평가 과정을 거쳐 객관적이고 일관된 결과를 출력한다. 이를 통해 축산업에서 품질 평가 효율성을 높이고, 영상처리 기술을 활용한 자동화 시스템의 발전에 기여할 것으로 기대된다. -
Hyunjun Cho;Taehoon Kim;Shinjae Kang;Joohyoung Cha;Choonghan Lee;Yongin Kwon 340
본 연구는 ROS2 Humble 기반의 자율 이동형 감시 로봇을 개발하여 효율적인 실내 보안 시스템을 구현한다. 로봇은 SLAM을 통해 실내 지도를 작성하고 Nav2를 활용해 정확한 경로 탐색 및 자율 주행을 수행한다. 또한 YOLOv5 기반 객체 탐지와 얼굴 인식 기술을 융합하여 허가자와 침입자를 실시간으로 구분할 수 있도록 설계하였다. 로봇은 360도 라이다, 초음파 센서, 카메라 등 다양한 센서를 통합하여 주변 환경을 정밀하게 인지하며, 실내 환경을 효과적으로 모니터링한다. 본 연구를 통해 가정이나 시설에서 활용 가능한 효율적이며 확장 가능한 자율 보안 시스템 구축 방안을 제시한다. -
Quwon Lee;Seongjae Lee;Minji Kim;Byeongseok Ryu;YoungGyun Kim 342
운전자의 인지적 특성의 영향과 자율주행차량의 영상 처리 분석 한계로 차량의 충돌사고로 인한 인명 및 물적 피해가 증가하고 있다. 본 논문에서 제안하는 회피 경로 계획 알고리즘은 도시 거리 이미지에서 ResU-Net 모델을 통해 도로 영역을 분할하고 YOLO-DeepSORT 알고리즘으로 주행 방해 요소를 검출한 다음 A* 알고리즘과 OpenCV를 활용하여 예상 경로를 시각화한다. 이후, 예상 경로를 분석하여 최적의 회피 방향을 지정한다. 본 알고리즘은 사람이 운전하는 상황뿐만 아니라 자율주행차량에서도 주행 방해 요소를 피할 수 있도록 예상 경로와 회피 방향을 화면상에 시각화하여 차량 충돌 사고를 예방하는 데 기여할 것으로 기대된다. -
비행 중의 UAV는 실시간으로 촬영하는 영상 데이터를 무선 영상 링크를 통하여 지상국으로 전송한다. 지상국은 장거리에서도 무선 영상 링크를 안정적으로 연결하기 위하여 지향성 안테나를 사용하는데, 지향성 안테나는 UAV와 정확하게 정렬할수록 높은 품질의 영상 데이터를 수신할 수 있다. 본 연구에서는 UAV가 MAVLink를 통하여 전송하는 GPS 정보를 바탕으로 지향성 안테나를 UAV의 방향과 정렬할 수 있도록 하는 안테나 추적기를 설계하였다. 또한, 안테나의 방향각과 기울기를 정밀하게 측정할 수 있는 센서들을 사용함으로써 UAV에 대한 향상된 추적 성능을 제공하고, 전계 강도 측정 센서를 사용하여 지향성 안테나의 영상 링크 수신 품질을 측정할 수 있도록 함으로써 안테나 추적기의 최적 정렬 여부를 직접 검증하는 방법을 제시하였다.
-
Woo-Seung Song;Sae-Yeop Jung;Eun-Saem Ko;Ji-Yoon Chun;Me-Jin Lee 350
본 연구는 AI 를 활용하여 온라인 강의 영상의 음성을 자동으로 텍스트로 변환하고, 이를 다국어로 번역하여 자막을 생성 및 관리하는 자동화 시스템을 설계하였다. Faster Whisper 기반의 음성 인식 모델을 통해 강의 음성을 텍스트로 변환한 후, MarianNMT 기반의 텍스트 생성 모델을 활용하여 주요 언어(한국어, 영어, 일본어, 중국어 등)로 번역 자막을 생성하며, 생성된 자막은 서버에 저장된다. 사용자는 강의 시청 시 원하는 언어의 자막을 실시간 지연 없이 응답 받을 수 있으며, 관리자는 번역 품질이 낮거나 전문 용어가 부정확한 경우 직접 검수 및 수정할 수 있도록 하였다. 본 시스템은 실시간 번역 방식에 비해 서버 부하를 줄이고, 사용자 경험을 개선하며, 자막 품질을 일정 수준 이상으로 유지할 수 있다는 점에서 효율적인 대안이 될 수 있다. -
Soyeon Kim;Jinhyang Kim;Minju Kang;Yunhye Cho;Junghoon Lee 352
본 논문에서는 클라우드 혹은 개별 서버에 저장된 스트림기반 FHIR 객체를 연속적으로 읽어와서 디스플레이 하는 응용을 설계하고 구현한다. 파이썬의 웹 인터페이스, 애니메이션, JSON 로딩 라이브러리 기능을 활용하여 기능의 확장성을 기하고 병렬처리를 위해 웹과 디스플레이 부분을 각각의 프로세스로 설계하며 이중 버퍼에 의해 모듈간 동기화를 구현한다. -
Eun-Ji Lee;Hyun-Woo Nam;Eun-Seo Kim;Kyung-Keun Song;Seong-Hyun Cho;Hyung-Bong Lee 354
기존 대부분의 단체 채팅방은 채팅방을 먼저 생성하고 이를 기준으로 채팅 참여자를 초대하고 대화하는 채팅방 중심 모델이다. 이번 프로젝트에서 우리가 개발하고자 하는 채팅 앱 유형은 현재 나의 위치를 기준으로 내가 설정한 거리 이내의 사람들과만 대화할 수 있는 사용자 중심 모델입니다. 사용자 중심 모델의 채팅방은 참여자들 사이의 채팅 목적과 소통 방식 등의 차이나 이견을 줄여 채팅방의 분화를 예방하고 채팅의 소통 효율성을 높이는데 도움이 된다. -
Chan-Hyeong Lee;Ga-Eun Nam;Min-Ju Kim;Ji-Young Jang;Young-Jong Kim 356
본 플랫폼은 대학 공지사항을 한 곳으로 통합하여 자동 수집하고, 사용자의 관심사에 맞춰 필터링 및 알림을 제공하는 시스템이다. 동적 페이지네이션 크롤링 기법과 최적화 기법을 활용해 신뢰성 높은 서비스를 제공하며, 이를 통해 사용자는 공지사항을 빠르게 확인하고 불필요한 탐색 시간을 줄일 수 있다. -
RAVEN (Risk Analysis Virtual ENvironment)은 아이다호 국립 연구소(INL)에서 개발한 다변수 불확실성 정량화 및 실시간 위험 분석을 위한 시뮬레이션을 제공하는 프레임워크이다. RAVEN 은 원자력 발전소의 위험 관리를 위한 소프트웨어로 개발되었지만 범용적인 위험 관리 소프트웨어로 기능한다. 기존의 계산 소프트웨어인 MATLAB이나 UQpy 등은 오픈소스가 아니거나 통합된 환경을 제공하지 않는 점 등의 약점이 있는데 반해 RAVEN 은 그것에 강점이 있다. 본 연구에서는 RAVEN 의 장점을 포함한 특징과 설치 및 구동에 대해 간단히 논하고, PBS 등을 이용한 대규모 실시간 병렬 처리 시스템 운영 구조를 논한다. 또한 RAVEN 이 제공하는 기계학습 라이브러리를 응용할 방법을 살펴본다. 마지막으로 해당 프레임워크가 실시간 연료 효율 분석, 실시간 경로 탐색 등의 문제 상황에서 어떤 우위가 있는지 논한다.
-
본 연구는 Demand Responsive Transit(DRT) 환경에서 다양한 배차 전략을 복합적으로 적용한 최적화 모델을 제안하고, 시뮬레이션을 통해 그 성능을 분석하였다. 기존 단일 전략 기반 배차 시스템의 한계를 극복하기 위해, 거리, 대기시간, 정류장 밀집도 등 다양한 요소를 가중치로 조합한 복합 전략 모델을 설계하였다. 시뮬레이션 결과, 복합 전략은 단일 전략에 비해 실차율과 배차 성공률에서 우수한 성능을 보였으며, 민감도 분석을 통해 전략 가중치 조합의 영향도 함께 검증하였다.
-
Chan-Gyu Kim;Hang Thi Phuong Nguyen;Hie-Yong Jeong 364
최근 근감소증 진단을 위한 근육량 평가 방법으로 초음파를 이용한 근두께 측정이 제시되고 있다. 그러나 초음파를 이용하여 근두께를 측정하는 방법은 수작업으로 이루어져 주관적인 편차가 있을 수 있으며, 시간이 많이 소요되는 단점이 있다. 이에 본 연구에서는 실제 근감소증이 있는 노인의 앞정강근 초음파 이미지를 사용하여 U-Net 모델을 통해 근막을 자동으로 분할하고 근두께를 자동으로 측정하는 모델을 제안한다. 제안된 방법은 초음파를 이용한 근육량 평가의 객관성과 효율성을 높이며, 근감소증 진단의 정확도 향상에 기여할 것으로 기대된다. -
Byung-Jin Song;Seung-Wook Shin;Yu-Geon Koh;Gyeng-Tae Kim;Jun-Seong Kim 366
본 연구는 기존 지하시설물 탐사 기술의 한계를 극복하기 위해 GPR, EML, Sonde, vLoc, AML 등 5 종의 탐사 장비를 융합한 복합 탐사 방식(Tetra Solution)을 제안하였다. 세종시 조치원 지역 하수도 정비사업에 본 솔루션을 적용한 결과, 비금속 관 불탐률 감소, 위치 정합도 향상, 작업 시간 단축 등 실질적인 개선 효과를 확인하였다. 향후에는 AI 기반 신호 분석 기술 및 AR/VR 실시간 시각화 플랫폼과의 융합을 통해 탐사 자동화와 작업자 시야 기반 안내 기능이 강화될 수 있을 것으로 기대된다. -
Jeong-Hun Kim;Yu-Bin Seong;Kyu-Bo Sim;Ju-Hyun Lee;Ye-Eun Im;Mi-Hwa Song 370
멀티모달 SNS 분석 프레임워크 Aura는 SNS 사용자 반응을 정량화하고, 채널 단위의 지지도(Influencer Support Score, ISS)를 산출한다. SNS 콘텐츠를 음성, 얼굴 이미지, 텍스트로 분리하고 Attention Fusion 방식으로 통합하여 영상 내 감정 흐름을 분석한다. SNS 댓글에는 감정 분석과 주제 분류를 실행한다. 이후 댓글 작성 유형을 기반으로 사용자들을 군집화하고, 댓글 감정, 주제, 사용자 유형, 콘텐츠 감정 흐름 간 정합도를 바탕으로 ISS를 도출한다. Aura는 멀티모달 통합 분석을 통해 인플루언서 분석과 마케팅 전략에 유효한 인사이트를 제공한다. -
Jin-Hyeok Park;Khurshedjon Farkhodov;Seon-Ja Lim;Yeong-Rak Choi;Hak-Soo Lim;Kwon Ki-Ryong 372
This study highlights the integration of ArcGIS and Deep Learning models to advance coastal flood risk prediction and prevention. By combining spatial analysis with predictive modeling, the proposed approach improves the accuracy and resolution of flood mapping, supporting faster and more effective disaster preparedness. Our results demonstrate that the model can be adapted to prioritize precision, recall, or balance, depending on application needs. This integrated method shows strong potential for expanding to other vulnerable coastal areas, contributing to enhanced global flood resilience. -
Ju-Hun Park;Su-Min Song;Seo-Yeon Lee;Seol-Bin Cho;Yeong-Jun Cho 376
기존 발표·면접 연습은 객관적 피드백 부족으로 실력 향상에 한계가 있었다. 본 연구는 이를 개선하기 위해 AI 기반 한국어 발표·면접 시뮬레이션 및 맞춤형 피드백 웹 서비스를 개발하였다. 시스템은 STT 기반 내용 정확도, GMM 기반 음향 품질 및 안정성, 간투어 사용 빈도를 종합 분석하여 발화를 정량적으로 평가한다. 사용자는 스크립트 발표 연습과 AI 질문기반 면접 연습을 통해 실전처럼 훈련하고, 타임스탬프 기반 피드백으로 약점을 개선할 수 있다. 본 연구는 효과적인 자가 학습 도구를 제공하고, 한국어 스피치 코칭 연구의 기초를 마련한다는 점에서 의의가 있다. -
본 연구는 소프트웨어 아키텍처의 설계 원칙을 분산 시스템에 적용하는 것을 목표로 한다. 특히 SOLID 원칙을 중심으로 소프트웨어 개발 과정을 분석하고 Unity 기반의 퍼즐 게임을 개발하여 실질적 적용 가능성을 검증하였다. 연구 결과, 설계 원칙을 준수한 소프트웨어는 기존 대비 높은 정확도와 안정성을 보였다. 본 연구는 분산 시스템 설계 및 소프트웨어 개발 교육에서 활용할 수 있는 사례를 제공하고자 한다.
-
Giyu Kim;Seonjeong Kim;Minyoung Park;Yueun Oh;Jisun Han;Youngjong Kim 383
여행 기록을 효과적으로 관리하려는 수요가 증가하면서 다양한 정보가 개별적으로 저장되고 활용되기 어려운 문제가 발생하고 있다. 이러한 한계를 개선하기 위해 제안하는 서비스 TripLog는 사용자의 여행 경로를 지도에 표기하고 사진과 글을 함께 저장할 수 있는 여행 기록 관리 플랫폼이다. 사용자는 이를 통해 여행 경험을 체계적으로 관리하고 2단계 딥러닝 기반 협업 필터링 알고리즘 추천 시스템을 활용하여 개인 맞춤형 여행지를 탐색할 수 있다. 이 알고리즘은 대량의 데이터의 효율적인 처리를 위해 설계 되었다. 또한, 서비스에서 제공하는 여행 기록 공유 기능은 사용자 간 정보 교류를 활성화하는 데 기여한다. -
Chansu Yoon;Batzaya Ayalguu;TaeWoon Hwang;Jaemin Chun;Jehui Lee;Youngjong Kim 385
본 프로젝트는 알바생과 관리자가 효율적으로 근무 일정을 관리하고 시급을 계산할 수 있도록 지원하는 통합 시스템을 개발하는 것이다. 기존의 시간표 관리 앱은 개인 일정 관리에 초점을 맞추고 있으며, 시급 계산 앱은 단순 계산 기능만 제공하는 한계를 가지고 있다. 본 프로젝트에서는 팀 단위로 근무 일정을 관리하고 급여를 자동 계산하는 기능을 결합하여, 사용자 편의성을 극대화한 웹 애플리케이션을 제안한다. -
Jin-ho Lee;Ye-jun Pyun;Won-bin Lee;Yi Kim;Seol-young Jeong;Min-hee Kim 387
본 논문은 기존 CPS 플랫폼의 보안 취약성, 수작업 문제 출제, 비효율적인 Q&A 처리 문제를 해결하기 위해 AI 기반 웹 플랫폼을 제안한다. KoGPT 를 활용한 문제 생성, Sentence-BERT 기반의 Q&A 자동 응답, 사용자 인증 및 관리자 기능이 포함된 본 시스템은 실시간 처리와 작업 효율성을 크게 향상시킨다. 제안된 플랫폼은 창의력 대회의 운영 편의성과 확장 가능성을 높이는 실질적 대안이 될 수 있다. -
Chan-young Na;Tae-il Yoon;Seo-hyun Lee;Jin-yong Chun 389
본 연구는 Firebase와 Firestore를 기반으로 한 서버리스 아키텍처를 활용하여 실시간 멀티플레이 기능을 갖춘 카드 게임을 구현하는 데 중점을 둔다. 서버리스 환경에서도 클라이언트-서버 아키텍처를 유지하며, 게임의 핵심 로직은 Firebase Cloud Functions로 처리되고, 게임 상태는 Firestore 및 Realtime Database를 통해 실시간으로 동기화된다. 또한 Firebase Authentication, Cloud Storage 등을 연계하여 사용자 인증, 리소스 관리, 상태 반영 등 전체 게임 흐름을 안정적으로 지원한다. 앱 내 상태 관리는 Provider를 통해 구성되어 실시간 반응성과 유지보수성을 높였다. 이러한 기술 스택을 통해 별도의 서버 관리 없이도 확장성과 안정성을 갖춘 멀티플레이 게임 구조를 구현하였다. -
Ji-Woo Geum;Gun-Ho Do;Seok-Lee;Dong-Hyeon Jang;Eui-Jin Hwang;Youngjong Kim 391
본 논문은 질환성 장애 및 의존에 따른 개인 맞춤형 추적 관찰 시스템의 필요성과 구현 방안에 대해 다루고 있다. 본 시스템은 기존의 분산된 의료 정보 서비스, 복약 관리, 챗봇 등을 통합하여 사용자 중심의 플랫폼을 제공한다. 이를 통해 의료 정보 접근성, 복약 순응도, 복약량 최적화 및 사용자의 심리적 안정감을 향상시키고자 한다. 또한, AI 기술을 활용하여 사용자의 건강 상태를 예측하고 개인화된 치료 및 예방 전략을 제안하여, 다양한 질환과 중독 문제를 해결하는 데 도움을 줄 수 있다. -
Hyeon-Woo Cheon;Ki-Baek Kim;Min-Seo Kim;I-heon Kim;Jae-Hyeon Kim;Youngjong Kim 393
본 논문은 밴드 공연을 희망하는 사용자를 위한 통합 생태계 플랫폼 구축을 목표로 한 프로젝트를 소개한다. 이 플랫폼은 기존 음악인 커뮤니티의 핵심 기능을 재구성하고 확장하여, 사용자 편의성과 실질적 협업 가능성을 높이고자 한다. 주요 기능으로는 외부 합주실 예약 사이트와의 API 연동을 통한 편리한 예약 시스템, 플랫폼 내에서 팀의 공연장을 홍보하고 공연장 대여 정보를 제공하는 기능, 그리고 사용자 실력 수준에 따른 팀 매칭 기능이 있다. 이러한 기능들은 사용자들이 보다 효율적으로 팀을 구성하고, 공연을 기획하며, 실제 활동으로 이어질 수 있도록 돕는다. 본 논문은 해당 시스템의 구조와 기능, 사용자 중심의 설계 요소를 중심으로 플랫폼의 구현 방향을 제시한다. -
Ji-Su Lee;Da-In Kim;Hyeon-Ju Sung;Ha-Jun Kim;Jin-Woo Lee;Young-Jong Kim 395
본 논문은 대학생의 팀 프로젝트 수행 과정에서 발생하는 비효율적 요소를 해소하기 위해 설계된 iOS 기반 협업 애플리케이션 TeamPool 을 제안한다. TeamPool 은 시간표 병합을 통한 회의 시간 시각화, 음성 기반 회의 요약, 팀·개인 일정 통합 관리, 친구 기반 팀 구성 기능 등을 하나의 플랫폼 내에서 제공함으로써 팀플 수행의 효율성과 편의성을 동시에 향상시키는 것을 목표로 한다. 본 시스템은 Swift 기반의 모바일 클라이언트와 Spring Boot 기반의 서버, MySQL 데이터베이스 및 AWS 클라우드 인프라를 바탕으로 구현되었으며, 기능별 흐름 및 시스템 구조를 시각 자료와 함께 제시한다. -
Eun-Hyuk Koh;Jin-Su Jo;Jae-Rim Kim;Suraksha Tamang;Youngjong Kim 397
본 연구는 대학생을 주요 사용자로 하는 웹 기반 매칭 플랫폼 "야, 너두 CC 할 수 있어"의 설계 및 구현에 관한 내용을 다룬다. 최근 온라인 데이팅 서비스는 급격히 증가하고 있으나, 대부분의 플랫폼은 일반 대중을 대상으로 하며 대학생 특화 기능을 제공하지 않는다. 본 시스템은 학교 이메일 인증 기반의 사용자 등록, 다차원 필터링을 적용한 맞춤형 매칭 알고리즘, 프라이버시를 고려한 닉네임 UI 등 차별화된 기능을 포함한다. 프론트엔드는 React, 백엔드는 Spring Boot, 데이터베이스는 MySQL을 기반으로 구축되었으며, 실제 매칭 흐름을 고려한 유저 경험 중심의 설계를 통해 매칭의 정확도와 사용자 만족도 향상을 도모하였다. -
Da-Yeon Park;Hye-Yeon Hyeon;Si-Eun Gu;Seongmin Kim 399
SBOM(Software Bill of Materials)은 SW 구성요소 명세서로 소프트웨어 내 필요한 부분마다 태그를 삽입하고 목록화하여 구조를 파악할 수 있도록 해주는 기술로, 최근 공급망 보안의 핵심 요소로 자리매김하였다. 보편적으로 쓰이는 SBOM 표준 형식에는 SPDX와 CycloneDX가 있고, 도커 이미지에 대한 해당 형식의 SBOM 생성을 지원하는 대표적제가 도구로는 Syft와 Trivy가 존재한다. 본 연구에서는 형식과 도구별 SBOM 생성에 대한 정량적·정성적 비교 분석을 통해 신뢰도 높은 SBOM 생성을 위한 형식 및 도구 선택에 대한 근거를 제시하고자 한다. -
Ye-Jin Jin;Ki-Du Kim;Dong-Young Yoo;R. Young Chul Kim 401
최근 대규모 언어 모델의 발전으로 대부분의 소프트웨어 개발자는 AI 코드 보조 도구를 활용하는 추세이다. 그러나, AI 기반 코드는 품질 보장 및 검증이 필요하다. 이 문제를 소프트웨어 공학적 시도로, 단계적 AI 적용으로 증명하고자 한다. 개발 프로세스 내에서 요구사항 단계에 AI를 적용하여 분석하고, 설계를 추출하고, 코드를 자동 생성하고자 한다. 즉, 자연어 기반 코드 자동화 메커니즘을 제안한다. 이를 위해 1) 요구공학 분야에 LLM을 접목하여 체계적인 분석, 2) UML 설계 추출, 3) 모델 변형 기법을 통해 코드 생성 자동화를 수행한다. 본 연구는 전통적인 방법의 확장으로 자연어 요구사항 중복성 제거 및 설계 메타모델을 통합한다. 이를 통해 코드와 테스트 케이스의 중복을 줄일 수 있다. 우리는 AI 기법을 소프트웨어공학의 단계적 절차에 접목함으로써 인간 중심의 코드와 AI 기반 코드 비교 검증을 기대한다. -
Requirements specifications are necessary and important in system development, but they often do not exist or are incomplete. One approach to address this is automatically generating formal logical specifications from source code. However, these generated specifications are typically difficult for non-technical stakeholders to understand, hindering verification. To bridge this gap, this study investigates translating logical specifications into natural language using Large Language Models (LLMs).
-
본 연구에서는 Android 10-13 버전 업데이트 문서의 프라이버시 항목을 대상으로, 문서 구조화 기반의 자동 변경 식별 파이프라인을 설계한다. 해당 문서에서 수집한 총 3,743개의 문장을 10개의 의미 기반 클러스터로 분류하고, 각 클러스터별 대표 문장을 추출하여 전체 문서 검토 없이 주요 변경 사항만으로 테스트 설계가 가능하도록 지원한다. 전체 문장의 약 89%가 상위 3개 클러스터에 집중되어 있어, 문서 분석과 테스트 설계의 우선순위 결정을 더욱 효율적으로 수행할 수 있음을 실험적으로 확인하였다.
-
k-평균 군집화 분석은 주어진 데이터 집합에서 유사한 데이터의 군집을 찾고 이를 분석하는 기법으로 널리 사용되어 왔다. 그러나, 데이터 집합에 대해 적절한 k 를 찾는 방법에 대한 연구는 부족하며 평가 계수의 전수 비교에 의존해 왔다. 본 연구에서는 이를 경감하기 위한 그리드 기반 근사 군집 분석을 통한 k 추정 기법을 제안한다. 제안 기법의 성능을 10,000~100,000 개의 데이터를 갖는 생성 데이터 집합을 활용한 검증 결과 다양한 k 와 데이터 집합의 크기에 대해 효과적임을 보였다.
-
Seong-Un Cho;Masoud Reyhani Hamedani;Sang-Wook Kim 413
일부 최신 그래프 연구는 정확도 향상에만 초점을 맞추거나 정확도보다 메모리 효율성을 우선적으로 고려한다. 그러나 효과적인 그래프 임베딩 방법은 정확도와 메모리 효율성을 동시에 제공해야 한다. 따라서 본 연구에서는 15 개의 최신 방법을 대상으로, 8 개의 실세계 데이터셋에서 정확도와 메모리 효율성 간의 트레이드오프를 비교 분석한다. 이를 통해 실세계 어플리케이션에서 효과적인 그래프 임베딩 방법 선택 시, 정확도와 메모리 효율성을 종합적으로 고려할 수 있는 실질적인 가이드를 제공한다. 실험 결과, 메모리 제한 환경에서는 그래프 압축 기반 방법이, 높은 정확도가 요구되는 어플리케이션에서는 유사도 기반 방법이 가장 효과적임을 확인하였다. -
Jinyoung Yu;Jisu Lim;Jiho Shin;Trung Hau Tran;Youngjong Kim 417
본 연구는 구조화되지 않은 웹페이지에서도 상품 정보를 자동으로 추출할 수 있는 경량화된 알고리즘을 제안한다. ViDE에서 제시된 시각적 반복 구조 감지 원리를 기반으로 하되, 머신러닝이나 대규모 학습 없이 렌더링 정보를 활용하여 반복되는 상품 블록을 탐지하고, 이를 통해 상품명, 가격, 이미지 등 핵심 정보를 규칙 기반으로 추출한다. 해당 방식은 다양한 구조의 개인 쇼핑몰 웹페이지에 적용 가능하며, 향후 크롤링 기반 통합 쇼핑 플랫폼에 활용될 수 있는 실용적인 웹 정보 추출 접근 방식으로 기대된다. -
디지털 전환 가속화로 SAP 시스템에서 비기술 인력 활용이 증가하고 있다. 본 연구는 GPT 기반 AI 를 활용해 자연어 입력만으로 SQL 쿼리와 ABAP 프로그램을 자동 생성할 수 있는 SAP 기반 No-Code 솔루션을 제안한다. 해당 솔루션은 SAP GUI, GPT API, SAP Database 를 연계하여 프로그램을 생성하며, 개발 지식 없이도 ERP 시스템 활용을 가능하게 한다.
-
본 연구는 SAP S/4HANA 환경에서의 Column 과 Row Store 테이블에 대한 단 건 조회 성능을 분석·비교한다. 저장 방식과 Secondary Index 유무를 조합한 4 개의 테이블의 레코드 규모에 따른 조회 성능을 측정하였다. 분석 결과 Secondary Index 유무에 따라 저장 방식 간 성능 격차가 발생하며, 존재 시 Row Store 가 더 효율적인 처리 성능을 나타냈다. 이는 Secondary Index 가 Optimizer 의 탐색 비용을 증가시킨 것으로, 기존 Standard Table 의 저장 방식과 인덱스 전략에 대한 재검토의 필요성을 제시한다.
-
Sunyoung Sohn;Chanyeong Jung;Jee-Hyun Koo;Byung-Suk Seo;Kwang-Man Ko 423
본 연구는 Na+, K+, 포도당과 같은 생체 지표의 연속 모니터링에 최적화된 확장 게이트 유기 전기화학 트랜지스터(OECT) 아키텍처를 활용한 비침습적 웨어러블 바이오센서의 특징들을 분석하였다. 전자소자 설계 외에도 실시간 생체신호 수집 및 전송에 내재된 주요 보안 위협이 되는 요소들을 진단함으로써 하드웨어 보안 모듈(HSM), 보안 부팅 프로토콜, 블록체인 기반 데이터 무결성 관리를 포함한 다층 보안 접근 방식을 제안하고자 한다. -
본 논문에서는 GPTs, LangChain, LlamaIndex 등 대표적인 챗봇 프레임워크의 구조와 구성 요소를 비교·분석 하고, 이를 기반으로 새로운 능동적 지식 학습 기반 챗봇 프레임워크를 제안한다. 기존 RAG 모델과 Tool Calling 기반 챗봇이 기존 저장된 지식과 명세된 애플리케이션을 사용하는 방식과 달리, 능동적 지식 학습 챗봇 프레임워크는 Knowledge Base를 구성하여 지식 데이터와 애플리케이션 기능 명세를 저장하고, LLM이 답변에 필요한 지식과 애플리케이션 동작을 능동적으로 요청하여 챗봇에 사용한다. 이를 통해, 사전에 모든 데이터를 명세할 필요 없이, 챗봇이 답변에 필요한 데이터를 동적으로 불러오고 실시간으로 갱신되는 데이터를 같은 구조로 사용할 수 있다.
-
이 논문은 GPU 클러스터 시스템에서 생성된 과금 로그를 분석하여 사용자가 수행한 작업의 종류를 자동으로 분류하는 기법을 소개한다. KISTI 슈퍼컴퓨터 5호기의 보조 GPU 클러스터 시스템인 뉴론에서 2023년 5월부터 2024년 10월까지의 사용자가 제출한 5만5천개의 작업 중에서 작업의 종류가 분류되지 않는 약3천개의 작업에 대한 분류를 위해 다양한 머신 러닝 및 딥러닝 알고리즘을 적용하여 분류를 시도하였다. R의 신경망 패키지 nnet은 82.5%의 정확도를 보였고, svm, Naïve Bayes, Logistic Regression(vglm), OneR은 각각 78.1%, 71.4%, 73.9%, 74.8%의 정확도를 보였다. 본 연구를 통해 GPU 클러스터 시스템에서 수행되고 있는 작업의 특성을 파악하고 추가적으로 향후 신규 클러스터 시스템의 구축 및 운영 방향을 결정하는데 도움을 줄 수 있을 것으로 기대한다.
-
본 연구는 운동선수의 장거리 이동이 부상 위험에 미치는 영향을 분석하고자 한다. 시차 적응, 회복 시간 부족, 누적 출전 등이 선수의 생체 리듬에 영향을 주며 이는 부상으로 이어질 수 있다. Julian Alvarez, 손흥민, 이재성 선수의 사례를 통해 이러한 문제의 현실성과 심각성을 확인하였다. 향후 이동시간, 경기 간격, 출전 수 등과 부상 발생 간의 상관관계를 분석함으로써, 구단, 선수 협회, 개인 선수에게 데이터 기반 기초 자료를 제공하고자 한다.
-
본 연구는 대규모 철골 구조물의 시공 순서 최적화를 위해, 구조 정보 기반의 Zone 구획화와 이를 활용한 차원 축소, 그리고 초기 토너먼트 선택 전략을 결합한 이중 적응형 유전 알고리즘(ZITAGA)을 제안한다. 제안 기법은 BIM 의 IFC 데이터를 활용하여 부재 정보를 추출하고, 수직 부재를 기준으로 구조적으로 안정적인 Zone 을 형성한 후, 각 Zone 간 선후관계를 수학적으로 표현한 MOCC 를 생성한다. 이후 초기 개체군을 토너먼트 방식으로 선택하고, DADGA 의 적응형 교차 및 변이 확률 조정 기법을 적용함으로써 수렴 속도와 최적해 도달률을 향상시킨다. 실험 결과, 기존 GA 및 DADGA 대비 제안 기법은 세대 수, 계산 시간, 최적도 측면에서 우수한 성능을 보였으며, 특히 복잡도가 높은 구조에서도 안정적인 결과를 도출하였다.
-
Kun-Woo Park;Bo-Hyun You;Eun-Ji Choi;Seo-Eun Hwang;Jin Kim 439
현대 사회에서 생활 폐기물의 증가와 분리배출 실천 부족은 재활용률 저하와 환경 오염을 초래하고 있다. 특히 20대 청년층 다수는 분리배출 기준에 혼란을 겪고 있으며, 실제 대학생들을 대상으로 한 설문조사에서도 많은 응답자가 어떤 항목에 분류해야 할지 어려움을 느낀 것으로 나타났다. 이는 기존의 분리배출 시스템이 실생활에서 충분히 이해되고 있지 않음을 보여주는 결과이며, 사용자가 보다 쉽게 분리 기준을 이해하고 실천할 수 있도록 안내해주는 시스템의 필요성이 대두되고 있다. 본 연구는 딥러닝 기반 이미지 분류 기술을 활용하여 다양한 쓰레기를 자동으로 인식하고 분류하는 스마트 시스템을 개발하고자 한다. 이를 통해 누구나 쉽게 분리배출을 실천할 수 있는 환경을 제공하고, 자원 순환 및 환경 보호에 기여하는 해법을 제시한다. -
본 연구는 전기차 주행 가능 거리 예측의 정확도를 향상시키기 위해, 실제 대규모 주행 데이터를 기반으로 Bayesian Additive Regression Trees(BART) 모델을 활용한 예측 프레임워크를 소개한다. 데이터 내 존재하는 분산과 비선형성을 효과적으로 반영하기 위해 베이지안 트리 앙상블 구조를 채택하였으며, 성능 비교를 위해 트리 기반 모델과 베이지안 선형 회귀 모델을 기준 모델로 설정하였다. 실험 결과, BART 는 모든 평가 지표에서 가장 우수한 성능을 나타냈으며, 비선형 관계 학습과 예측 불확실성 추정이 주행 거리 예측 성능 향상에 기여함을 확인할 수 있었다. 확보된 실험 결과는 향후 주행거리 불안 해소와 전기차 보급 확대에 기여할 가능성을 제시한다.
-
Byung-Jin Song;Ju-Min KIM;Won-Tae Seo;Hee-Jin Lee;Jae-Hoon Park 443
본 연구는 서울 열린데이터 광장의 공공데이터를 활용하여 의료비 부담에 대한 국민 인식 수준을 정량적으로 분석하고, 이를 시각화를 통해 가시화함으로써 정책 지원이 필요한 대상 집단을 도출하고자 하였다. 응답자 특성을 성별, 연령, 소득 수준별로 분류하고, 각 계층별 의료비 부담 인식을 비교 분석하였다. 분석 결과, 저소득 고령층 및 특정 지역군에서 의료비 부담도가 상대적으로 높게 나타났으며, 이에 기반하여 우선 지원이 필요한 정책 대상 집단을 제안하였다. 또한, 공공데이터를 기반으로 하는 의료복지 정책 수립의 필요성과, 데이터 활용 체계의 고도화 방안에 대해 논의하였다. 본 연구는 향후 의료복지 정책 설계 및 취약계층 지원 전략 수립에 기초자료로 활용될 수 있을 것으로 기대된다. -
Byung-Jin Song;Min-Ku Song;Ji-Kyun Yoo;Seung-Min Oh;Seo-Yeon Hwang 447
본 연구는 기후변화로 인한 생태계 리스크에 선제적으로 대응하기 위해 GIS 기반 공간정보와 생태 빅데이터를 융합하여 통합정보관리시스템을 구축하는 것을 목표로 하였다. 다양한 기관 및 센서로부터 수집된 정형 및 비정형 생태 데이터를 공간 데이터베이스로 통합하고, 이를 클라우드 기반 데이터 허브를 통해 실시간 분석 및 시각화할 수 있도록 설계하였다. 시스템은 데이터 표준화 및 품질관리를 기반으로 생태계 변화 예측, 리스크 모니터링, 정책 수립 지원 기능을 제공하며, 정부기관, 연구기관, 산업체 및 국민 대상 서비스로 확장성을 확보하였다. 본 연구를 통해 생태계 기후변화 대응력 강화 및 국가적 생태 보전 정책 지원에 기여할 것으로 기대된다. -
신장암 RNA-seq 데이터에서 기존 통계 기반 DEG 분석은 발현량 변화와 샘플 간 변동성으로 인해 한계가 존재한다. 이에 본 연구에서는 SelectKBest, L1 페널티 기반 로지스틱 회귀, SVM 분류를 단계적으로 결합한 기계학습 기반 유전자 선별 방법을 제안하였다. 최종적으로 2,000 개의 유전자를 사용해 SVM 모델을 학습하고 분류 기여도가 높은 300 개의 유전자를 선별하였다. 나아가, KEGG 경로 분석을 통해 신장암과 관련된 주요 면역 및 대사 경로를 유의미하게 포착하였다.
-
Su-Min Kim;Gyeong-Min Kim;Da-Eun Jung;Go-Eun Kim;Hyon Hee Kim 453
서울시의 현재 착한 가격 업소 지정은 가게의 신청과 기관의 현장방문 검사가 필수적으로 진행된다. 본 연구는 광진구 지역 내 착한 가격 업소를 효율적으로 발굴하기 위해, 현장 검증 대신 사용자 리뷰 데이터 분석을 활용하여 가격, 위생, 서비스 측면에서 점수를 산출해 가게를 선정하는 다중 지표 종합 평가 모델을 제안한다. -
Heeseo Jeong;Dajeong Lee;Kyujin Cho;Charmgil Hong 456
전기차 배터리의 열화 현상은 전기차 시장 성장의 큰 걸림돌이 된다. 본 연구는 배터리 열화를 진단할 수 있는 지표로 1 년 뒤 시점의 주행 가능 거리를 예측한다. 먼저 전비를 예측하고 이를 주행 가능 거리로 변환하는 방법을 제안하여 배터리가 완전히 방전되기까지의 데이터 없이 주행 가능 거리를 예측할 수 있다. 2 년간 371 대의 차량에서 수집된 Battery Management System(BMS) 데이터는 정교한 전처리를 거쳐서 Feature Tokenizer Transformer 모델의 입력으로 사용된다. Feature Tokenizer Transformer 는 변수 타입에 관계없이 입력 특성 사이의 복잡한 관계성을 효과적으로 학습하여 BMS 데이터와 같은 표 형식 데이터 처리에 적합하다. 실험을 통해 본 연구에서 제안한 접근 방식이 주행 가능 거리 예측 문제에 효과적으로 적용될 수 있음을 확인하였다. -
Jin-Hui Jeong;Seo-Young Kim;Seon-Ho Choi;Hyun-Hee Kim 460
본 연구는 스킨케어 제품 구매시 제품의 내재적 특성을 중시하는 소비자의 스마트 소비 경향을 반영하여 구매 이력, 리뷰, 함유 성분 및 효능 정보를 통합한 하이브리드 추천 시스템을 제안한다. 리뷰 임베딩 및 성분 기재 원칙을 활용해 제품 간 유사도를 정교하게 측정하고, 생성형 AI 를 활용해 추천 사유와 키워드를 생성하여 설명가능성을 강화하였다. 이를 통해 소비자에게 신뢰도 높은 맞춤형 추천 경험을 제공하는 데 기여할 수 있다. -
Ngumimi Karen Iyortsuun;Soo-Hyung Kim;Soonja Yeom;Hyung-Jeong Yang;Aera Kim 463
Depression's neurophysiological basis remains poorly understood, particularly regarding functional connectivity patterns. This study examines EEG coherence differences between 46 major depressive disorder (MDD) patients and 75 healthy controls (HC) from the PRED+CT dataset. Statistical analysis revealed significant reductions in global coherence across all frequency bands in depression, with the strongest effects observed in theta and delta bands. Support Vector Machine classification achieved promising performance, with the best results in the beta band (accuracy=83.28) despite this band showing the smallest statistical effects. This discrepancy suggests that different aspects of coherence data may contribute to biomarker development versus neurophysiological understanding of depression. -
본 논문은 Speech-to-Text(STT)와 GPT 기반 문맥 분석을 결합한 인공지능 긴급 신호 감지 알고리즘을 제안한다. 기존 시스템은 키워드에 의존해 정확도가 낮았으며, 본 시스템은 STT로 변환된 텍스트를 GPT에 입력하여 문맥을 분석하고, 키워드 없이도 긴급 상황 여부를 자동 판단한다. 실제 데이터 기반 실험 결과, 기존 방식 대비 우수한 정확도, 정밀도, 재현율을 보였다. 본 알고리즘은 독거노인 보호 등 다양한 분야에 적용 가능성을 지닌다.
-
현대 사회에서 다양한 상황의 구조 요청은 중요한 문제이다. 기존 시스템들은 음성 통화나 문자 메시지에 의존하여 제약 있는 환경에 적용하기에 문제가 있었다. 본 논문에서는 인공지능을 이용한 손동작 구조요청 시스템을 제안한다. 제안한 시스템은 미리 설정한 손동작을 기반으로 위험 상황을 단계(긴급, 중간, 경미)별로 분류하여 신속한 구조 요청을 가능하다. 특히, 다양한 상황과 사용자를 고려해 접근성을 높이고, 비언어적 의사소통의 효율성을 강화가 제안하는 시스템의 목적이다.
-
본 연구는 트랜스포머 모델의 어텐션 메커니즘에서 출력 희소성을 유도하기 위한 활성화 함수 대체 기법을 제안하고, 그 효과를 정량적으로 분석한다. 기존 softmax 기반 어텐션은 전 범위에 걸쳐 비선택적인 활성화를 발생시키며, 이는 연산 비효율성과 해석의 어려움을 초래한다. 이를 해결하기 위해 softmax 를 sparsemax 또는 ReLU 로 대체하고, 후자의 경우 bit-shift 기반 정규화를 적용해 하드웨어 효율을 높였다. 실험 결과, 두 대체 함수는 평균 80% 이상의 출력 희소성을 유도하였으며, 추론 속도, 메모리 사용량, 전력 소모 측면에서 유의미한 개선을 보였다. 성능 지표인 BLEU 점수는 softmax 대비 소폭 감소하였으나, sparsemax 의 경우 희소성과 정확도 간의 균형이 가장 우수하였다. 제안한 방식은 연산 자원이 제한된 환경에서도 트랜스포머 모델의 효율적 운용과 해석 가능성을 동시에 확보할 수 있는 실용적 대안을 제공한다.
-
MyeongCheol Gwak;DaeMin Kim;SungJae Kim;JunCheol Ahn;SangHyun You;HyoSang Jeon;JaeHyeong Hong;SeJin Park 474
이 논문은 오버투어리즘 문제와 기존 키워드 기반 여행 검색 시스템의 한계를 해결하고자, 대규모 언어 모델(LLM)과 RAG 기법을 활용한 대화형 여행 추천 서비스를 제안한다. 사용자는 자연어로 여행 목적과 선호 조건을 입력하면 맞춤형 관광지 및 일정을 추천받을 수 있고, 이는 단순 검색보다 직관적이다. RAG 기법을 통해 외부 지식 기반에서 정보를 검색해 LLM 과 결합함으로써 덜 알려진 장소에 대한 추천도 가능하다. 시스템은 MSA 구조로 설계되어 확장성과 유지보수에 용이하며, 다양한 모듈이 독립적으로 작동한다. 사용자들은 파티 시스템을 통해 비슷한 취향을 가진 사람들과 함께 여행할 수도 있고, 여행 경험을 공유함으로써 정보의 다양성과 실용성을 높일 수 있다. 이를 통해 개인화된 추천은 물론 사회적 연결을 촉진하는 새로운 형태의 관광 플랫폼을 지향한다. 궁극적으로 이 서비스는 여행 준비의 번거로움을 줄이고 새로운 관광 경험과 만남을 가능하게 하며, 관광 산업의 새로운 패러다임을 제시한다. 그리고 LLM 의 검색 결과를 보았을 때 정답율이 대략 90% 정도 나오는 것을 확인할 수 있었습니다. -
생의학 분야에서 개체명 인식은 주어진 텍스트에서 질병명, 유전자명, 화학물질명 등을 판별하는 기술이며 새로운 지식 추출, 개체간 관계 발굴에 응용된다. 본 논문에서는 생의학 개체명 인식 성능을 바이오 텍스트로 사전훈련된 BERT 계열 언어모델의 가중합, 병합, 게이트 네트워크 앙상블을 수행한다. 본 논문에서는 언어모델의 임베딩 단계에서 앙상블을 수행하여 개별 모델이 놓친 특정 패턴에 대한 추가 정보를 확보하고, 언어의 표현력을 강화시키며, 불균형한 데이터로 인한 오류를 줄였다. 이를 통해 기존 연구의 성능보다 높은 성능인 최고 성능 f1 score 0.9148을 기록하였다.
-
Chang-Woo Jeon;Jun-Seong Shim;Si-On Yang;Kang-Hun Yun;Dong-Yoon Lee;Seok-Joo Koh 480
소상공인의 매출은 날씨, 요일, 계절성과 같은 다양한 외부 요인에 영향을 받지만, 이를 반영한 자체 예측 시스템을 구축하기는 어렵다. 이에 본 논문에서는 K-Means 기반의 상권 분류, Prophet 을 활용한 시계열 기반 매출 예측, 그리고 XGBoost 을 이용한 외부 요인 보정을 통합한 앙상블 구조를 제안한다. 시스템은 데이터 수집부터 저장, 학습, 예측까지 자동화되며, 실험 결과 Prophet 대비 XGBoost 보정 후의 MAE 가 개선됨을 확인하였다. 제안된 모델은 소상공인의 매출 예측 정확도 향상과 경영 의사결정 지원에 실질적으로 기여할 수 있을 것으로 기대된다. -
Hyeon-Ji Yang;Hyunseo Oh;Myungeun Lee;Hyung-Jeong Yang;Hyung-Chae Yang 482
폐쇄성 수면무호흡증(Obstructive Sleep Apnea, OSA)은 수면 중 상기도 폐쇄로 인해 호흡이 저하되거나 중단되는 질환이다. 약물 유도 수면내시경(Drug-induced sleep endoscopy, DISE)은 이러한 상기도의 폐쇄 위치를 확인하는 데 유용하지만, 기존의 VOTE(Velum, Oropharynx, Tongue base, Epiglottis) scoring 방식은 판독자 간 평가 불일치가 크다는 한계를 가진다. 따라서 본 연구는 DISE 영상에서 VOTE 영역 폐쇄양상 분류 및 시계열 분석 기반 진단 보조 시스템을 개발하였다. 데이터는 전남대학교 병원에서 진단받은 532명의 환자로부터 수집된 DISE 영상을 사용하였으며, EfficientNet 모델을 기반으로 한 폐쇄양상 분류 모델은 8가지 클래스를 대상으로 80%의 정확도와 79%의 F1-Score를 나타냈다. 폐쇄양상의 시간적 변화를 분석하기 위해 추가로 Bi-LSTM(Bi-directional LSTM) 모델을 추가하였다. 적용한 결과 12가지 클래스에 대해 정확도와 F1-Score가 모두 89%로 우수한 성능을 나타냈다. 본 연구에서 개발한 시스템은 DISE 영상 진단의 객관성 및 재현성을 높여 의료진 간의 판독 편차를 감소시키고, 환자 맞춤형 치료 계획 수립의 정확성과 효율성을 높일 수 있다. -
최근 대규모 언어 모델(LLM)을 포함한 인공지능 기반의 서비스가 대두되고 있다. 하지만 전통적인 통계학적 방법이 수학이나 수치 데이터 처리에 있어서는 여전히 강점을 가진다. 본 연구는 무향 칼만 필터를 적응성 방식으로 사용해서 자세 추정(pose estimation)의 정확도 성능을 높이기 위한 방법을 제안한다. 특히 매 시점마다 자세 추정 모델의 추정 신뢰도 정보를 측정 공분산 행렬에 반영하여 필터의 적응성을 확보했다. 또한 이 방법은 자세 추정 모델의 중간 단계와 최종 단계에서 자세 추정의 불확실성을 감소시키고자 했다. 적용 사례로, 낙상 감지에서는 0.933의 F1-Score를 기록했다. 향후 적응성을 측정 외 기타 영역으로 확장시키고, 범용적인 적용을 위해 필터 기반의 복합 모델의 성능을 면밀히 검토하고자 한다.
-
Dae-Jun Park;Seong-Ho Park;Jung-Hun Seo;Ji-Woo Yang 490
짧은 길이의 영상이 주된 영상 소비의 대상이 되면서 최신 딥러닝 기술인 Vision Transformer(ViT)와 AI Hub의 동영상 콘텐츠 하이라이트 편집 및 설명(요약) 데이터셋을 활용하여 비디오 요약에 관한 기술을 제안한다. 해당 기술의 실용성을 검증하고, 보급하여 누구나 쉽고 기존 기술과 차별화된 요약 영상을 만들수 있게 한다. 주요 개발목표는 ViT 모델을 이용한 영상요약 기술 및 이론에 관한 연구결과와 성과를 발표한다. -
본 논문에서는 비디오 콘텐츠에 대한 자동 캡셔닝과 그에 맞는 배경음악 생성을 위한 통합 프레임워크를 제안한다. 우리의 접근 방식은 최첨단 비디오 이해 모델인 VideoLLaMA3 와 텍스트 기반 음악 생성 모델인 YuE 를 결합하여 비디오의 시각적 내용을 분석하고 이에 적합한 배경음악을 자동으로 생성한다. 제안된 워크플로우는 입력 비디오를 VideoLLaMA3 모델에 전달하여 비디오의 내용, 분위기, 감정을 설명하는 캡션을 생성하고, 이 캡션을 YuE 모델에 입력하여 비디오의 시각적 내용과 조화를 이루는 배경음악을 생성한다. 다양한 장르와 분위기의 비디오에 대한 실험 결과, 우리의 프레임워크는 비디오 내용에 적합한 고품질 배경음악을 생성할 수 있음을 보여주었다. 이 연구는 비디오 콘텐츠 제작, 자동 멀티미디어 콘텐츠 생성, 그리고 접근성 향상을 위한 응용 프로그램에 기여할 수 있다.
-
In-Seok Yang;Jun-Hyeok Lee;Jun-Hui Lee;Young-Jong Kim 496
클릭을 유도하기 위한 자극적인 제목인 clickbait 는 온라인 뉴스의 신뢰성을 저하시킬 수 있어, 이를 탐지하는 기술은 점점 더 중요해지고 있다. 기존 연구들은 주로 영어 데이터셋을 기반으로 하여 높은 성능을 보여주었지만, 한국어 뉴스 기사에 대한 탐지는 아직 충분히 다뤄지지 않았으며, 한국어에 특화된 탐지 방식도 거의 제안되지 않았다. 본 연구에서는 prompt-tuning 기법과 한국어 verbalizer 를 활용하여, 한국어 뉴스 기사 제목만으로 clickbait 를 탐지할 수 있는 모델 구조를 제안한다. 특히, 기존의 영어 기반 프롬프트 튜닝 기법인 PT-CD 를 한국어 환경에 맞게 변형하여 KoBERT 와 한국어 단어장 구성 전략을 적용하고, 여기에 한국어 특성을 반영한 feature 정보를 통합하는 방식을 함께 제시한다. 본 연구는 한국어에 특화된 프롬프트 기반 clickbait 탐지 프레임워크를 설계하고자 하고, 소량의 학습 데이터로도 효과적으로 동작할 수 있는 AI 모델을 제안한다. 향후 이 연구는 한국어에 특화된 프롬프트 튜닝 기반 자연어처리 기법의 가능성을 확장하고, 실용적인 응용 연구의 기반으로 활용할 수 있을 것으로 기대한다. -
Min-Kyu Park;Hong-Kwon Kim;Jae-Min Jeong;Jeong-Gun Lee 498
본 논문은 Jetson Orin Nano에서 다양한 복잡도의 YOLOv11 모델들을 이종의 전력 모드(7W, 15W) 및 GPU 클럭 주파수에 따라 추론 성능 및 전력소모, 에너지 소비 특성을 분석하였다. GPU가 특정 주파수 이상으로 설정되었을 때 딥러닝 모델의 추론 성능이 향상되지 않는 것을 확인하였으며, 이를 통해 최적의 GPU 클럭 주파수를 탐색할 수 있었다. -
기후변화로 인한 극한 기상현상의 증가로 낙뢰의 발생 빈도와 강도가 높아지면서 원자력발전소의 안전성 확보가 중요한 과제로 대두되고 있다. 현재 낙뢰 보호설계는 경험적 수식과 전기기하학적 이론에 기반하고 있으나, 실제 기상 조건과 지형적 요소를 충분히 반영하지 못하는 한계가 있다. 본 연구는 기상청의 LINET 낙뢰관측시스템과 종관기상관측(ASOS) 데이터를 바탕으로, 기계학습(Random Forest, XGBoost, SVM) 기법을 활용하여 낙뢰강도(kA)를 예측하고, 이를 통해 낙뢰 보호 도체의 최적 굵기를 산정하는 새로운 방법을 제시한다. 제안된 접근은 기존의 과도하거나 부족할 수 있는 설계 방식에서 벗어나, 실제 기상 데이터를 반영한 정량적이고 비용 효율적인 설계 기준 마련에 기여할 수 있다.
-
Karakurt Mehmet Fatih;Genis Tutku;YongSeong Lee;HuiJun Song;Seolyeong Jeong;Yongbin Bae 504
The evaluation of prompt-generated images remains a challenging task. We propose a content-aware similarity method based on structured, weighted captions generated by a fine-tuned vision-language model. Unlike existing metrics, our approach enables interpretable, field-level comparisons across semantic categories, closely aligning with human judgment. It rivals GPT-4 in performance while being vastly more scalable and cost-efficient-offering a reliable solution for automated, feedback-oriented image assessment. -
본 연구는 Raspberry Pi 5 환경에서 YOLOv8n 모델을 차량 번호판 데이터로 전이학습한 모델에 대해 가속기 없이 실행하는 방식(TFLite), 가속기 Coral TPU을 이용한 방식, Hailo M.2 HAT 가속기를 사용한 방식에 대해 성능비교를 수행 하였다. 성능비교 실험 결과 객체감지 측정값인 mAP(50-95) 는 3가지 방식이 유사한 값을 보였으나 Video FPS(Frame Per Second)측정치는 TFLite방식에 비해 Coral TPU 방식 약 2.0배, Hailo 방식은 약 7.6배의 성능향상을 보였다. Static Frame FPS 측정치는 TFLite방식에 비해 Coral TPU 방식 약 2.1배, Hailo방식은 약 19.8배의 성능향상을 보였다
-
Ji-Seob Kim;In-Gyeong Kang;Si-Hyeong Park;Jea-Hee Lee 508
본 연구는 엣지 컴퓨터(Edge Computer)인 Raspberry Pi 5와 USB용 인공지능 가속기 Coral TPU를 이용하여 실시간 휴대용 자동차 번호판 인식기를 설계 개발하고, 성능을 평가하였다. 제안하는 인식기는 입력 영상에서 자동차 번호판 영역을 탐지하기 위해 YOLOv8n 모델을 한국형 자동차 번호판 데이터로 전이학습을 수행한 검출(Detection)모델과 LPRNet모델을 동일한 데이터로 학습한 자동차 번호판 문자열 인식(Recognition)모델을 파이프라인구조로 연결하여 통합하는 방식으로 설계하였다. 본 연구에서 제안한 인식기의 성능평가 결과는 평균처리속도가 18.53 [fps], 인식성능은 98.34[%] 였다. -
Yu-Hyeon Jeong;Gi-Heon Do; Woo-Chan Hwang; Seung-Hwan Min; Ho-Yong Lee 510
거시경제 데이터는 투자 의사결정에 중요한 영향을 미치지만, 방대한 정보량과 분석의 어려움이 존재한다. 본 연구에서는 AI를 활용하여 금융 시장 및 경제 데이터를 자동으로 분석하고 주간 리포트를 생성하는 시스템을 제안한다. 본 연구에서 제안하는 시스템은 경제 지표, 금융 뉴스, 시장 변동성을 분석하며, 이를 기반으로 맞춤형 리포트를 자동 생성한다. 이를 통해 개인 및 기관 투자자가 보다 쉽게 경제 트렌드를 파악하고 투자 결정을 내릴 수 있도록 지원한다. 또한, 시스템의 효율성을 평가하기 위해 기존 금융 데이터 분석 기법과 비교하며, AI 기반 접근 방식의 정확도 및 신뢰성을 검증한다. -
Hwangyu Jung;Jinju Park;Myungeun Lee;Yoo Ri Kim;Hyung-Jeong Yang 512
임상 환경에서 심장 전문의는 표준 12 리드 심전도 및 연령, 성별과 같은 임상적 특징들을 기반으로 심혈관질환을 진단한다. 그러나 기존의 딥러닝 기반 심전도 자동 해석 모델들은 임상적 특징을 포함하지 않고 심전도만으로 심혈관질환을 분류한다. 따라서, 본 연구에서는 심전도, 연령 및 성별 정보를 활용한 심혈관질환 다중분류 모델을 제안한다. 제안된 모델은 연령과 성별 정보를 전처리 된 심전도 데이터와 결합하여, 임상적 특징에 따른 심전도 파형의 구조적 특징을 효과적으로 분석하였고 심혈관질환 자동분류 정확성을 향상시켰다. 실험 결과 연령과 성별 정보를 추가했을 때 심전도만을 사용한 기존 모델대비 F1-score 평가지표에서 더 우수한 성능을 보였으며, 이를 통해 연령과 성별 정보가 심혈관질환 분류에 있어 중요한 역할을 하고 있음을 확인하였다. -
We propose a Bandwise CNN ensemble framework for EEG-based sleep stage classification. The EEG signals were first decomposed into five standard frequency bands (Delta, Theta, Alpha, Beta, Gamma). For each band, an individual CNN was trained to capture band-specific features. The softmax outputs from these CNNs were then combined using a multilayer perceptron (MLP) meta-learner, enabling the model to make final predictions based on all band-level information. Compared to conventional full-signal models such as LSTM, CNN-LSTM, and Transformer, our ensemble approach achieved superior performance, reaching 92.23% accuracy on the Sleep-EDF dataset. Notably, the method demonstrated improved generalization to minority classes. These results highlight that frequency-specific modeling with CNNs can be more effective than sequential models for EEG-based sleep stage analysis.
-
대규모 언어 모델(LLM)의 발전으로 인간의 사고를 대체할 가능성이 커지며, 도덕적 판단에 대한 관심도 증가하고 있다. 그러나 영어 중심으로 학습된 LLM의 특성상, 한국어의 적용과 동양 윤리 원칙에 대한 연구는 미비한 상황이다. 본 연구에서는 LLM의 도덕적 편향을 분석하고, 저자원·고자원 언어 환경 및 동·서양 윤리 정책 적용 시 편향 변화 여부를 실험적으로 검증하였다. 이를 통해 LLM의 도덕적 판단이 언어·문화적 요인에 따라 어떻게 영향을 받는지를 규명하고자 한다. 실험 결과, LLM의 도덕적 판단이 언어적·문화적 맥락에 따라 달라질 수 있음을 확인하였으며, 이러한 연구 결과는 AI 윤리 가이드라인 수립과 콘텐츠 검열 정책 개선에 기여할 수 있을 것으로 기대된다.
-
재무 문제 풀이(Financial QA)는 관련 도메인 지식 이외에도 논리적 추론 능력이 필요한 과제이다. 본 연구는 이러한 문제를 해결하기 위해 LLM 프롬포팅 파이프라인 FinRQ를 제안한다. FinRQ는 재귀적 질문 전략을 재무 문제에 적용한 최초의 프롬포팅 기법으로, 확장 과정과 자기답변 과정을 통해 문제에 대한 구조적 이해와 논리적 추론을 수행한다. FinQA데이터셋을 활용한 실험 결과, FinRQ는 60.48%의 정확도를 보여 비교한 모델인 직접추론, Chain of Thought(CoT), EEDP에 비해 각각 10.6%p, 3.6%p, 1.7%p의 성능 향상을 보였다.
-
위성 영상 속 구름 탐지를 위해 딥러닝 기술이 많이 사용된다. 이때 클래스 불균형이나 탐지 난이도 문제 해결을 위해 손실 함수에 가중치를 추가하는 경우가 많다. 그러나 이는 목표 외 클래스에서의 탐지 성능을 저하시킬 수 있으며, 적절한 가중치를 위한 하이퍼 파라미터 튜닝이 필요한 경우도 있다. 따라서 본 논문에서는 손실 함수가 구름 탐지에 미치는 영향을 분석하고, 하이퍼 파라미터 튜닝 없이 전반적인 구름 탐지 성능을 올릴 수 있는 손실 함수 GDWCE 를 제안한다. 실험을 통해 GDWCE 가 Dice Loss 와 Cross-Entropy 보다 좋은 성능을 보여줌을 확인하였다.
-
Hyeon-Gyu Park;June-Hyuk Hong;Hyun-Su Kim;Se-Hun Cho;Youngjong Kim 526
최근 대규모 언어 모델(LLM)은 다양한 분야에서 활용되고 있다. 본 논문에서는 WhisperLive를 기반으로 실시간 강의 음성을 텍스트로 변환한 후, 이를 임베딩 및 RAG 기반 컨텍스트로 확장하고, Claude API를 활용하여 퀴즈를 생성하는 시스템을 제안한다. WhisperLive의 STT 기능을 통해 강의 내용을 실시간으로 변환하고, 관련 정보 검색과 자연어 처리 기술을 결합하여 학습자의 이해도를 높일 수 있는 맞춤형 퀴즈를 자동으로 생성할 수 있다. -
Sujin Lee;Chaeeun Kim;Soyeon Kim;Jieun Seo;Jin Kim 528
K-pop 의 세계적인 열풍에도 불구하고, K-pop 안무는 여전히 저작물로서 법적 보호를 받지 못하고 있다. 본 연구는 사전학습 된 Pose Estimation 모델을 활용하여 인체의 keypoints 관절 움직임을 추정하고, 이를 기반으로 서로 다른 곡의 안무 영상 간에 동작의 시작 지점과 속도가 다르더라도 유사한 프레임을 자동적으로 정렬함으로써, 안무 유사도를 정량적으로 측정하기 위한 기술적 근거를 제안한다. -
Dong-Hyun Lee;Ye-Jun Heo;Soo-Han Cho;Sung-Hwan Song;Yul Kwon;Youngjong Kim 530
본 프로젝트는 지도 기반 사진 공유 소셜 네트워크 서비스(SNS) 프레임워크로, 사용자가 업로드한 사진에 대해 AI 기반 해시태그 추천 기능을 제공하여 사용자 경험을 향상시키는 것을 목표로 한다. 해당 기능은 ViT-GPT2 모델을 활용해 이미지를 자연어 텍스트로 요약한 뒤, Flan-T5 모델을 통해 이를 적절한 해시태그를 추출하는 방식으로 구현된다. 본 프레임워크는 웹 기반으로 개발되며, 이미지 파일은 AWS S3에 저장되고, 저장된 이미지의 URL을 기반으로 AI 추론이 수행된다. 이미지에 대한 메타데이터 및 생성된 해시태그는 MySQL 데이터베이스를 통해 관리된다. -
한국어 텍스트는 고유한 언어적 특성으로 인해 감정 분석 모델 개발 및 데이터 세트 구축에 어려움이 있으며, 한국어 텍스트 기반 감정 분석 연구 동향을 종합적으로 파악하려는 체계적 문헌 고찰이 부족하다. 이에 본 연구는 PRISMA 방법론을 적용하여 한국어 텍스트 기반 감정분석에 대한 체계적 문헌고찰을 수행하고, 총 19 편의 논문에서 26 개 데이터 세트와 19 개 모델을 식별하였다. 주요 결과로 텍스트 중심 접근이 여전히 우세하나, 일부 연구는 멀티모달 및 대화형 확장과 특정 그룹 대상 분석을 시도하고 있었다. 모델 측면에서는 인공신경망 기반 모델과 사전학습 기반 모델 활용이 균형을 이루고 있다. 이는 향후 한국어 감정분석 연구에서 다양한 데이터 특성과 고도화된 모델 활용을 통한 정교한 분석이 가능함을 시사한다.
-
본 논문에서는 사용자가 촬영한 음료 이미지를 분석하여 관련 정보를 제공하는 시스템을 제안한다. 해당 시스템은 Flutter 기반 앱과 Spring Boot 서버로 구성되며, Google Vision API 를 활용해 이미지로부터 텍스트를 추출하고 검색어를 생성한다. 생성된 검색어는 구글 검색과 데이터베이스를 통해 관련 음료 정보를 조회하는 데 사용된다. 또한, 텍스트 검색과 이미지 기반 유사도 검색 기능을 함께 제공하여 사용자 편의성을 높였다. 본 시스템은 텍스트 기반 검색뿐만 아니라 이미지 유사도 기반 검색 기능을 제공하여 평균 정확도를 23%p 증가시켰고, 사용자 편의성과 탐색 효율성을 높였다.
-
상수도 분야의 누수 탐지는 주로 수용가의 신고에 의존해, 피해 발견까지 상당한 시간이 소요된다. 본 연구에서는 1시간 단위로 수집된 1,613세대 수용가의 수도 검침량 데이터에 비지도 학습 기반 딥러닝 모형을 이용한 이상 탐지 모델을 적용하여 누수를 탐지하는 방법론을 제안한다. LSTM-AE, LSTM-VAE, USAD 세 가지 모델을 구현하고 성능을 비교, 평가한 결과 LSTM-VAE의 F1 Score가 약 0.59로 상대적으로 우수한 결과를 보였다. 그리고 LSTM-VAE로 재현된 비지도 학습 기반 데이터와 이상치 점수를 통한 탐지가 잘 작동함을 시각적으로 확인하였다. 이는 신고 이전에 비지도 기반 딥러닝 모형을 이용한 실시간 탐지 모형 개발에 도움이 될 수 있음을 의미한다.
-
Byeong-Hoon Park;Yeong-Jun Hwang;Myeong-Gyu Lee;Ye-won Lee;Ki-Hwan Kim 542
본 연구는 신한울 1·2 호기 FSAR(Final Safety Analysis Report) 문서의 제 4 장을 기반으로, 대규모 언어모델(LLM)과 AI Agent 를 활용해 온톨로지를 구축하고, LangGraph 프레임워크를 사용하여 AI Agent 기반의 자동 정합성 판단 시스템을 구현하였다. 원전 관련 평가용 데이터셋을 활용한 실험에서 평균 5.5 초의 응답 속도와 평균 83.3%의 정확도를 기록하였다. 실험에서 14B 규모의 LLM 을 사용함에도 불구하고, GPT-4o 대비 8.7% 성능 향상을 보였으며, 아울러 온톨로지 기반의 구조적 탐색과 오픈소스 기반의 비용 효율성 및 확장 가능성을 입증하였다. -
강화학습(Reinforcement Learning, RL)은 복잡하고 동적인 환경에서 효과적인 의사결정을 가능하게 한다. 특히, Deep Q-Network(DQN)는 전통적인 강화학습과 비교할 때 고차원 상태 공간을 처리하는 데 강점을 보이나, 학습 성능의 일관성 부족과 속도 불균형 등의 한계가 발생한다. 본 연구는 DQN 에 신경망 가중치 복제와 Q-mix 기법을 통합한 방법을 제안한다. 가중치 복제와 제한된 업데이트로 계산 효율성을 높이고, Q-값 통합을 통해 의사결정의 신뢰성과 정밀도를 강화한다. 실험 결과에서는 전통적인 방법과 비교할 때 80% 이상 향상된 학습 속도와 안정성을 달성하며, DQN 의 기존 한계를 개선할 수 있는 잠재력을 확인하였다.
-
Dong-Jae Jang;Min-Jun Choi;Rakshitha Nagaraj;Hyum-Woo Kim;Seok-Joo Koh 549
CCTV 를 활용한 교통 모니터링은 스마트시티의 핵심 요소로, 본 연구는 배경 기반(Scene-Centric) 접근법을 통해 차량 이동 경로를 추적하는 새로운 트래킹 기법을 제안한다. 제안 시스템은 Cityscapes 데이터셋으로 학습된 SegFormer 모델을 활용해 도로와 차량 영역을 세그멘테이션하고, 픽셀(Pixel) 기반 움직임 감지를 통해 추적 대상을 식별한다. 이를 시작 위치 기반 그리드 클러스터링(Grid Clustering)으로 그룹화하여 상행/하행 방향을 자동 식별하며, 역주행 및 과속과 같은 이상 행동을 실시간 탐지한다. 야간 환경에서 헤드라이트로 인한 오탐지를 줄이기 위해 HSV 색상 공간 기반 적응형 가중치를 적용해 보았으나, 탐지 성능 개선이 필요함을 확인했다. 실험 결과, 제안 시스템은 주간 환경에서 평균 방향 식별 정확도 67.37%, 야간 환경에서 58.11%를 달성했으며, 야간 영상에서 YOLO+ByteTrack 대비 프레임 처리 속도가 62.19% 빠르고 FPS 는 164.48% 향상되었다. -
본 연구는 지식 통합기반 질의 응답분야에서의 RAG(Retrieval Augmented Generation), AutoRAG 와 KAG(Knowledge-Augmented Generation)기법의 성능을 비교 분석하였다. AutoRAG 는 자동화된 구성 탐색을 통해 최적의 RAG 파이프라인을 구성하고, 다양한 검색 및 생성 방식의 조합을 실험적으로 탐색함으로써 엄격한 정답 표현 및 중개정보 활용 질의에서 우수한 성능을 보였다. 반면 KAG 는 지식 그래프와 논리적 양식을 기반으로 한 질의 계획 및 추론 과정을 도입하여, 답변의 의미 전달 및 핵심 정보 반영과 복잡한 논리·수치적 추론이 요구되는 질의 유형에서 우수한 성능을 보였다. 본 연구에서는 2WikiMultiHopQA 데이터셋을 활용하여 EM, Relaxed EM, F1, Answer Similarity 지표를 통해 RAG, AutoRAG, KAG 성능 비교 분석을 실험 수행하여 비교실험치를 제시하였다.
-
본 연구는 휴대폰에서 동작하는 동서울대학교 안내 챗봇(Chatbot) 구현에 관한 것이다. 모바일 환경에서 사용자의 편의성을 극대화하기 위해, 음성 인식(Speech To Text, STT) 및 합성(Text to Speech, TTS) 기능을 탑재하여 음성 인터페이스를 제공하였고, 챗봇 서버(Chatbot Server)의 성능을 향상시키기 위해 동서울대학교 관련 데이터를 활용하여 PEFT(Parameter Efficient Fine-Tuning), RAG(Retrieval-Augmented Generation) 방식과 두 방식을 혼합한 하이브리드(Hybrid) 기법의 성능을 비교 평가하였다. 이후 실험 결과를 바탕으로 혼합형(Hybrid) 기법을 적용한 안내 챗봇 서버를 구축하였고, 클라이언트(Client)의 다양한 모바일 환경을 고려하여 안드로이드 폰(Android Phone)과 아이폰(iPhone)에서 동작하도록 설계 및 구현하였다.
-
Daewoong Kim;Dongheon Kim;Myeonghyun Kim;Minjun So;Taebin Han;Youngjong Kim 555
Personal color 진단, MBTI 등 '나'라는 개인에 대한 관심이 커져 개인화 되어가는 사회에서 헤어스타일의 관심도 높다. 디자이너에게 컨설팅을 받고자 할 때 소모되는 경제적, 시간적, 물리적 자원 소모를 해소하기 위해 헤어스타일을 추천해주고, 실제 이미지로 보여줌으로써 큰 자원 소모를 해소하는 서비스를 AI 기반 기술과 프레임워크 순서로 제안 및 소개한다. -
Van-Thien Phan;Hyung-Jeong Yang;Seungwon Kim;Ji-Eun Shin;Soo-Hyung Kim 557
Recent audio-driven talking face generation methods still face challenges in achieving naturally fluid lip synchronization, rich emotional expressiveness, and high-quality face generation, especially when balancing realism with emotional accuracy. These challenges stem from inadequate modeling of emotional nuances in facial motion and insufficient synchronization fidelity when generating lip movements from audio alone. We introduce CEmo, a novel GAN-based framework that employs dual U-Net architecture for both the generator and discriminator. By integrating conditional cross-attention in the generator, CEmo effectively aligns audio, identity, and emotional cues. CEmo produces highly realistic and emotionally rich talking face videos that are precisely synchronized with the input audio and can be dynamically modulated based on categorical emotional conditions. Through extensive experiments on the CREMA dataset, CEmo demonstrates superior performance across multiple evaluation metrics compared to existing state-of-the-art methods, showcasing its effectiveness in both synchronization and emotional expressiveness. -
본 연구에서는 DeepSeek-R1-Distill-Qwen-32B 모델을 교사 모델로 활용하여 LLaMA 3.2 1B 모델을 증류(Distillation)하여 추론 성능을 영어 문법 평가 도메인에서 제한적으로 적용하였다. 본 연구에서 제안한 모델은 안드로이드 폰 환경에서 구현하였다. 제안한 모델의 성능측정을 위해 Rule Based, Answer Relevancy, Answer Similarity, ROUGE-L, METEOR 5가지 성능지표를 사용하여 성능을 비교 평가한 결과 제안한 방식이 기존의 LLaMA 1B 모델에 비해 각 측정지표에서 13%, 0.016, 0.206, 0.152, 0.011 만큼 개선된 성능결과를 얻었다.
-
본 연구는 BLIP-2 모델에서 KVQA(Knowledge-aware Visual Question Answering)의 성능 향상을 목표로 한다. BLIP-2 모델에 RAG(Retrieval-Augmented Generation)의 최적화인 AutoRAG(Auto Retrieval-Augmented Generation)기술, PEFT(Parameter Efficient Fine-Tuning)기술을 적용하여 KVQA 성능개선을 위한 방식을 제안하였고 제안한 방식의 성능측정을 위해 answer relevancy, BLEU, METEOR, 3가지 측정지표를 사용하여 비교평가 하였다. 실험 결과를 통해 제안한 방식이 기존의 BLIP-2 모델 대비 answer relevancy, BLEU, METEOR 측정치에서 0.253, 0.017, 0.148 만큼 개선된 성능을 얻었다.
-
AI 의 분류 성능 저하를 개선하기 위해 under sampling 이나 경계 데이터를 제거하는 등 다양한 연구가 진행되어 왔지만, 여전히 데이터 경계의 복잡한 분포로 인한 근본적인 문제는 해결되지 않고 있다. 이러한 문제를 해결하기 위해 본 연구는 PCA 기반의 차원 축소 방법을 제안한다. 실험 결과에 따르면 제안한 방법은 클러스터 간 분리도 향상과 분류 성능을 원본 데이터를 이용한 종래의 방법 대비 10% 개선할 수 있었다.
-
본 논문은 글로벌 인공지능 모델 벤치마크에 사용되는 데이터의 품질검증 방법을 제안한다. 또한, 글로벌 규범 문화 평가를 위한 벤치마크 데이터 구축 사례를 소개하며, 주요 태스크별 품질검증 항목의 정량적, 정성적 검사 기준을 설명한다. 마지막으로, 신뢰성 있는 벤치마크 결과 도출을 위한 데이터 품질 확보의 중요성과 글로벌 데이터 품질 표준의 필요성을 강조한다.
-
Kyung-Eun Park;Sang-Bok Lee;Yeon-Je Cho;Ho-jin Yu 570
본 논문은 멀티모달 입력 기반의 생성형 AI 학습을 위한 비디오-텍스트 데이터의 품질을 평가하는 검증 방법을 제안한다. 비디오-텍스트 데이터에 적용할 수 있는 품질특성을 구분하고, 품질특성별 검증 방법 및 예시를 설명한다. 그리고 해당 품질검증 방법을 K-콘텐츠 특화 생성형 AI 솔루션을 위해 구축된 비디오-텍스트 데이터에 적용한 품질검증 사례를 소개한다. -
Seung-Hoon Lee;Min-Jun Choi;Aiperi Aibekova;Andrej Matos;Hyun-Woo Kim;Seok-Joo Koh 573
본 연구에서는 semantic 세그멘테이션 성능을 향상시키기 위한 difference 이미지 활용 방법을 제안하고, 그 효과를 분석하였다. 원본 이미지에 difference 이미지를 가중치를 적용하여 더하는 방식으로 통합하였으며, SegFormer 모델을 기반으로 실험을 수행하였다. 실험 결과, difference 이미지를 사용한 모델은 IoU, Recall, F1 Score 등에서 성능 향상을 보였다. 또한 학습 곡선 분석 결과, 더 빠른 수렴과 낮은 손실 값을 보였다. 본 연구는 간단하면서도 효과적인 방법으로 세그멘테이션 성능을 향상시킬 수 있는 접근 방식을 제안한다. -
도덕 감정과 정치 참여는 긴밀한 상관관계를 갖는다. 선행 연구에서는 온라인 국민 청원 데이터를 분석함으로써 도덕 감정이 형성하는 정치 참여 형태를 규명했다. 본 연구는 이에 더해, 청원이 다루고 있는 정치 이슈를 고려하기 위해 청와대 국민청원 게시판의 분류에 따라 청원을 나누고 도덕감정과 동의 수를 회귀 분석하였다. 분석 결과, 타인 비난(Other-Condemning), 타인 칭찬(Other-Praising), 자의식적(Self-Conscious) 도덕 감정 그리고 비 도덕 감정(Non-Moral Emotion)은 분야 별로 동의 수와 상이한 상관관계를 보이는 것으로 나타났다.
-
Taejun Kim;Insu Jeong;Joowan Kang;Seungjun Jo;Byungin Moon 577
최근 딥러닝 기반 영상 분할 방법은 정확도 측면에서 높은 성과를 보이고 있지만, 방대한 연산량과 복잡한 구조로 인하여 임베디드 플랫폼에서의 실시간 처리 및 구현에는 한계가 있다. 이러한 문제를 해결하기 위해 MobileNet 과 같은 경량 신경망을 활용하는 등의 다양한 시도가 이어지고 있으나, 하드웨어 자원이 제한된 환경에서는 신경망이 가지는 많은 매개변수로 인해 구현에 어려움이 있다. 이에 본 논문에서는 DeepLabv3+에 MobileNetV3-Large 를 백본 신경망으로 사용하면서, 매개변수와 연산량을 줄이기 위한 방법을 제안한다. 제안하는 방법을 통해 구현된 모델은 기존 모델에 비해 성능이 소폭 감소하였으나, 매개변수를 절반 이상 절감함으로써 자원 제약 환경에서의 효율성을 높일 수 있음을 확인하였다. -
Modern integrated development environments (IDEs) rely on code completion as a key feature to enhance coding efficiency and streamline the developer workflow. Traditional approaches to code completion have often relied on rule-based techniques, static ranking, and prefix-based filtering, which pose challenges in terms of usability and efficiency. Recent research has introduced LR-parsing-based approaches that generate structural candidate suggestions by leveraging language syntax and open-source programs, but they often require manual refinement. Meanwhile, recent advancements in large language models (LLMs) have significantly amplified predictive performance in code completion tasks. However, despite these progress, the impact of LLM selection on LR-parsing based syntax-aware code generation remains underexplored. In this study, we conduct a comparative analysis of the performance and impact of two prominent LLMs, ChatGPT 3.5 and Llama 3, within an LR parsing-based code completion framework. Our experiments, evaluated using SacreBLEU and SequenceMatcher accuracy metrics, reveal that ChatGPT 3.5 achieves higher accuracy than Llama 3, underscoring the importance of selecting an appropriate LLM for enhanced code completion. These findings highlight the role of model selection in LLM-based code completion using LR parsing. Future research could extend this comparative analysis to a broader range of LLMs.
-
Byeong-Hoon Park;Younguk Han;Yeong-Jun Hwang;Myeong-Gyu Lee;Ki-Hwan Kim 584
본 연구는 경호 환경에서 발생할 수 있는 위험 징후를 실시간으로 감지하기 위해, 객체의 출현, 소실, 이동 및 정지 상태를 기반으로 변화율을 계산하는 경호 특화 Vision AI 시스템을 제안한다. YOLO12 와 ByteTrack 을 결합한 본 시스템은 추가 학습 없이 다양한 환경에 적용 가능하다. 실내·실외 시나리오 실험 결과 실내의 경우 본 시스템은 객체의 등장부터 정지 탐지까지 약 3 초(실험참가자: 약 8 초), 실외의 경우 약 5 초(실험 참자자: 약 10 초)가 소요되어 본 시스템이 실험 참가자보다 각각 2.6 배, 2 배 빠르게 위험 객체를 인지하였다. 변화율은 각 지표에 가중치를 부여한 수식을 통해 계산되며, 임계 값 초과 시 자동으로 경고를 발생시킨다. 특히, 사람이 여러 CCTV 를 동시에 감시할 때 발생하는 인지 지연 문제를 극복하고, 화면 수에 관계없이 병렬 분석을 통해 높은 감시 효율성을 유지한다. 본 연구는 변화율 기반 객체 탐지 모델의 실효성을 입증했을 뿐만 아니라, 향후 LLM 기반 지휘 체계와의 연계를 통해 문맥 해석 및 자동 대응 판단이 가능한 지능형 경호 시스템으로의 확장 가능성을 제시한다. -
IoT 기기의 확산으로 생성되는 데이터가 급증하면서, 빠른 처리와 개인정보 보호를 위한 엣지 컴퓨팅 기반 연합학습 방식이 효율적인 대안으로 주목받고 있다. 엣지 컴퓨팅 환경에서 연합학습을 수행하는 종래 연구에서는 모든 노드를 학습에 참여시키거나 기여도 기반으로 일부 노드를 선택하는 방식을 제안하였으나, 비독립적 데이터로 인한 성능 저하와 학습 참여 기회의 불균형으로 인한 공정성 저하 문제가 발생한다. 엣지 연합학습 환경에서 성능과 공정성의 트레이드 오프 문제를 해결하기 위해서 본 논문은 성능과 공정성의 중요도에 따라 학습에 참여하는 클라이언트를 동적으로 선택하는 방식을 제안한다. 실험 결과에 따르면, 한 요소가 중요한 환경에서도 성능-공정성 균형을 맞추지 않을 시 균형 점수가 감소하였으며 두 요소의 균형 조정이 필요함을 증명하였다.
-
본 논문에서는 교차 도메인 인간 행동 인식에서 타겟 도메인의 시각 데이터 없이도 효과적인 도메인 적응이 가능한 새로운 제로샷 도메인 적응(Zero-shot domain adaptation) 방법을 제안한다. 기존의 도메인 적응 방법들은 타겟 도메인의 일부 시각 데이터를 필요로 하는 반면, 본 연구에서는 CLIP과 같은 시각-언어 모델 (Vision-language models)에서 추출한 의미 정보를 활용하여 타겟 도메인의 시각 데이터 없이도 효과적인 도메인 적응을 수행할 수 있는 프레임워크를 제안한다. 구체적으로, 프레임워크는 소스 도메인의 동영상과 텍스트 설명 간의 관계를 활용하여 타겟 도메인의 텍스트 설명만으로도 소스 동영상 임베딩을 증강하여 도메인 적응을 수행한다. 제안된 방법은 HMDB-51 및 UCF-101 행동 인식 벤치마크 데이터셋에 대한 다른 모델과의 비교실험에서 시각 데이터 없이 상당한 성능 개선을 달성하며 우수성을 증명하였다.
-
본 연구에서는 3D U-Net의 활성화 함수(ReLU)를 Spiking Neural Network(SNN)의 Leaky Integrate-and-Fire(LIF) 뉴런으로 대체한 Spiking 3D U-Net 모델을 구현하였다. 의료영상 데이터셋인 MICCAI 2017 ACDC를 활용하여 기존 모델과의 분할 성능 및 전력 효율을 비교하였다. 실험 결과, Spiking 3D U-Net은 기존 3D U-Net보다 낮은 IoU 성능을 보였으나, 약 20%의 전력 소비 절감을 확인하였다. 이는 Spiking 뉴런의 희소한 발화 특성에 따른 연산 효율 향상에 기인한 것으로 해석된다. 향후 연구에서는 데이터 증강을 통한 학습 데이터 확대와 SNN 구조의 개선을 통해 모델의 성능과 일반화 능력을 향상시키고자 한다.
-
Ji-Won Seong;Han-Young Kim;Han-Gyeol Cho;Hyun-Soo Jo;Se-Chul Oh;Seong-Cheol Park 595
본 논문은 엔진 정지(Engine Shutdown)와 직결되는 냉각 계통을 대상으로, 딥러닝 기반 시계열 예측을 통해 이상 시점을 현재 시점 기준으로 정량적으로 추정하는 기법을 제안한다. 이를 통해 기존의 이상 탐지 중심 예지 정비에서 정비 시점 예측 중심의 접근으로 확장 가능성을 제시한다. -
스마트 양식장에서 넙치의 이동 궤적을 정확하게 추적하는 것은 행동 모니터링, 사료 공급 최적화, 양식장 관리 효율 향상 등에 핵심적인 기능이다. 본 논문에서는 CCTV 동영상 내에서 넙치의 이동을 추적하기 위해서 ByteTrack, BoT-SORT, SMILEtrack 세 가지 알고리즘의 재식별 성능을평가한다. 이 알고리즘들을 동일한 넙치 동영상 데이터 세트에 적용하여 재식별의 추적 정확도, 궤적 연속성에 미치는 영향을 평가한다.
-
컴퓨터 비전 기반 객체 추적은 다중 대상을 시간 축에 따라 분석하는 핵심 기술로, 넙치 양식장의 어류 건강 모니터링에 활용 시 질병 조기 진단이 가능하다. 본 논문에서는 실제 양식장 환경에서 촬영된 영상 데이터를 활용해 YOLOv8 기반 객체 검출기로 넙치를 자동으로 검출하고 BoT-SORT 알고리즘으로 객체를 추적하고, 이를 통해 정상 개체와 에드워드, 비브리오 감염 개체 간 행동 차이를 정량적으로 분석한다. YOLOv8 객체 검출기와 BoT-SORT 추적 알고리즘을 결합하여 이동 궤적, 평균 속도 및 회전율을 산출해 비교한다.
-
Seojun Lee;Seungwoo Lee;Yuig Gweon;Hojin Ryu;Hanul Kim;Hoon Ko 601
본 연구는 대규모 언어 모델(Large Language Model, LLM)을 한국 문학 작품에 특화된 형태로 파인튜닝하여 작가들의 창작 과정을 지원하는 플랫폼 개발에 관한 것이다. 기존 문학 창작 도구들이 단순 문법 교정이나 표현 제안에 그쳤다면, 본 연구에서 개발한 플랫폼은 작가의 개성과 스타일을 학습하여 맞춤형 창작 지원을 제공한다. 한국 현대 문학 작품 데이터셋을 기반으로 학습된 모델은 작가의 문체 분석, 플롯 구성 제안, 캐릭터 발전 방향 제시 등 창작의 전체 과정에서 실질적인 도움이 될 것으로 기대한다. -
Jun Youn Park;Young Jae Kim;Sung Hyun Kim;ShinAe Shin;Kwang Gi Kim 603
의료 인공지능(AI) 기술의 발전과 함께, 다양한 모델의 성능을 객관적으로 비교하고 검증할 수 있는 의료 리더보드의 필요성이 대두되고 있다. 본 연구는 의료 리더보드 운영을 위한 정책 방향과 구현 방안을 제안한다. 주요 내용으로는 의료 데이터의 특수성을 고려한 평가 지표 설계, 환자 안전성과 임상적 유효성을 담보할 수 있는 검증 절차, 개인정보 보호 및 비식별화 기준, 참여기관 간의 공정한 비교를 위한 표준화된 데이터셋 구축 등이 포함된다. 또한, 지속 가능한 리더보드 운영을 위한 제도적·기술적 지원체계와, 공공성과 투명성을 보장하는 거버넌스 모델에 대해 논의하였다. 본 연구는 향후 의료 AI 기술의 신뢰성과 활용도를 높이기 위한 리더보드 정책의 기본자료로 활용될 수 있을 것으로 기대된다. -
Si-Hyeong Noh;Hyung-Bon Koo;Dong-Wook Lim;Chang-Won Jeong 607
돌발성 감각신경성 난청은 국내에서 연간 유병률은 10만 명당 10명 이상으로, 대개 일측성으로 발생하지만 5~10% 정도는 양측성으로 발생한다. 일반적으로 사용되는 전신 스테로이드와 고실 내 스테로이드 치료 후에도 30% 정도는 영구적인 난청의 후유증을 남길 수 있기 때문에 예후를 향상시킬 수 있는 보조적인 치료에 대한 연구가 필요하다. 최근에는 인공지능 기술의 발전으로 SSNHL을 포함한 다양한 질병의 예후를 예측하기 위한 머신러닝 모델을 사용하는 연구가 진행되고 있다. 본 연구에서는 예후가 좋지 않은 고도 난청의 돌발성 감각신경성 난청 환자 중 고압산소치료의 시행 여부에 따라 회복예측률을 다양한 머신 러닝 모델을 통해 평가하고자 하였다. -
실시간 방범 시스템에서는 위급 상황을 자동으로 신속히 인지하고 정확하게 경보를 전달하는 것이 중요하다. 엣지 컴퓨팅을 활용하면 데이터 처리의 지연시간을 줄이고 프라이버시 보호 및 네트워크 부하 감소 효과를 얻을 수 있다. 본 논문은 엣지 디바이스 환경에서 실시간으로 동작 가능한 객체 탐지 모델과 상황 설명을 위한 언어 모델을 분석하고, 이를 통합한 지능형 방범 시스템 구현 방안을 제안한다. 이를 통해 본 연구는 엣지 기반 방범 시스템의 실질적인 모델 선택과 설계를 위한 종합적 분석을 제공함으로써 향후 유사 시스템 구현에 유용한 지침을 제시하고자 한다.
-
설, 추석 등으로 대표되는 명절 기간에는 평소의 교통 패턴과는 매우 다른 교통 패턴이 관찰된다. 이러한 교통 패턴은 과거 교통량의 패턴을 학습하여 미래 교통량을 예측하는 기존 교통 예측 시스템의 예측을 방해한다. 이처럼 데이터의 한계로 인해, 오로지 과거 교통량 데이터에 의존하는 기존 연구들은 명절 기간에 교통 예측 정확도가 크게 저하되는 문제를 겪고 있다. 이에 본 연구에서는 포털 사이트에서 제공하는 여러 검색어에 대한 포털 검색량 데이터를 추가 정보로 활용하여 정확도를 개선하는 딥 러닝 기반 교통 예측 시스템을 제안한다. 경부고속도로의 8 년간 명절 기간 데이터를 대상으로 실시한 실험 결과, 제안 방안은 우리나라 경부고속도로 데이터에 대해 최신 교통 예측 시스템과 비교하여 3%에 가까운 개선된 교통 예측 정확도를 나타냈다. 이를 통해 본 연구는 포털 검색량 데이터를 활용하는 접근법이 명절과 같이 교통 상황이 급변하는 경우에 대한 예측 정확도를 효과적으로 개선할 수 있음을 보였다는 점에서 큰 의미가 있다.
-
Vision-language models (VLMs) are highly sensitive to prompt phrasing, which can substantially affect performance. While automatic prompt tuning methods improve performance in low-data scenarios, these methods still rely on handcrafted prompt initialization, leaving room for further performance improvement. To address this, we propose a lightweight meta-prompt learning framework that uses Model-Agnostic Meta-Learning (MAML) combined with gradient clipping to train generalizable prompts under simulated few-shot settings. Unlike prior approaches that require large-scale pretraining and introduce auxiliary networks, our method preserves the original prompt tuning structure, offering better interpretability and practical applicability. Through experiments on 11 diverse datasets, we show that our meta-prompts consistently outperform handcrafted prompts in zero-shot classification and, when used for fine-tuning, maintain or even improve generalization performance. Our findings highlight the potential of simple, data-efficient meta-prompt strategies to improve robustness and transferability in prompt tuning.
-
사전 설정을 통한 고정된 경로에 의존하는 AGV(Automated Guided Vehicle) 시스템은 동적 환경에 취약하여 다양한 환경에 유연하게 대응할 수 있는 AMR(Autonomous Mobile Robot)이 대안으로 주목받고 있다. AMR 의 자율적인 판단 능력을 높이기 위한 제어 방법으로 강화학습이 제시되고 있으나, 해석 가능성과 적용성의 제약 조건이 존재한다. 본 연구는 이러한 문제를 보완할 방안으로 강화학습과 대형 언어 모델의 연계를 제안하며, 기술 융합 가능성과 직면한 과제를 검토하고자 한다.
-
스마트폰, PC, 태블릿과 같은 디지털 기기에서 문자를 시각적으로 표현하기 위해서는 디지털 폰트가 필수적이다. 다양한 디자인 요소가 가미된 폰트는 동일한 문장이라도 각기 다른 분위기를 연출할 수 있으며, 개인의 개성을 표현하기 위해 손글씨 폰트에 대한 관심이 증가하고 있다. 일반적으로 정형화된 폰트를 제작하기 위해서는 폰트 디자이너가 모든 글자를 직접 그려야 하는 과정이 필요하므로 많은 시간과 노력이 요구된다. 특히 손글씨같은 비정형화된 폰트 제작은 더욱 어렵다. 본 논문에서는 Diffusion Model 기반의 DK-Font를 활용하여 편지와 일기에 있는 손글씨 이미지로부터 한 벌의 손글씨 폰트를 자동으로 생성하는 방법을 제안한다. 또한, 손글씨 폰트가 생성된 결과를 비교하였으며, 평가지표로 그 효과성을 검증하였다.
-
딥러닝 모델은 이미지 분류를 비롯한 다양한 분야에서 우수한 성능을 보여주고 있으나, 적대적 공격(adversarial attack)에 취약하다. 이를 해결하기 위해 적대적 학습(adversarial training)을 통해 적대적 공격에 대한 견고성을 강화하지만, 정상 데이터에 대한 성능 저하가 동반되는 문제점이 있다. 이러한 일반화 성능의 하락이라는 문제를 완화하기 위해, 본 연구는 견고성 보존과 일반화 성능 향상에 있어서 배치 정규화(Batch Normalization, BN) 레이어의 중요성을 알아보고, RiFT(Robustness Critical Fine-Tuning) 기법을 확장하여 파인튜닝 대상에 포함하는 방안을 제안한다. 또한, BN 레이어를 포함하여 파인튜닝하는 경우 적대적 학습된 모델의 통계적 특성을 효과적으로 보정함으로써 견고성과 일반화 성능을 동시에 개선할 수 있음을 실험적으로 검증한다.
-
대규모 언어 모델(LLM)은 높은 계산 비용과 메모리 요구량으로 인해 실용적인 배포와 활용에 어려움이 있다. 이를 해결하기 위해 모델의 크기를 줄이고 연산 효율성을 향상하는 다양한 양자화 기법이 개발되었다. 그러나 현재까지의 연구는 주로 영어 기반 모델과 데이터에 초점을 맞추고 있으며, 비영어권 언어에서의 성능 저하 문제는 거의 다루어지지 않고 있다. 최근 연구에 따르면, 양자화를 다국어 대규모 언어 모델에 적용할 경우 성능 하락이 영어보다 비영어권 언어에서 훨씬 더 크게 나타나는 경향이 있으며 한국어 또한 그에 해당한다. 본 연구에서는 이러한 문제를 해결하기 위해 한국어에 최적화되도록 개량된 양자화 기법을 제안한다. 개선된 양자화 방법은 한국어 태스크에 대해 기존 양자화 방법에 비해 개선된 성능을 보였다.
-
Minho Park;Jongmin Lim;Subin Cha;Inho Oh;Kwangsoo Kim 638
본 연구는 HSV-DBSCAN에서 제안된 HSV 색상 임베딩이 실제 3D Visual Grounding 성능 향상에 기여하는 이유를 실증적으로 분석한다. HSV 색공간을 활용할 경우, 객체의 색상 특성에 따라 적절한 구성 요소(hue, saturation, value)를 기준으로 자연스러운 색상 군집이 형성된다. 유채색은 주로 hue 값 기준으로, 무채색은 saturation과 value 기준으로 밀집되며, 이는 객체 간 색상 구분에 있어 더 뚜렷한 경계를 제공한다. 본 논문에서는 다양한 색상 분포를 갖는 3D 장면을 기반으로 이러한 군집화 특성을 시각화하고, HSV 기반 임베딩이 3D 객체의 색상 구분에서 RGB 대비 우위를 가짐을 정량적으로 분석한다. -
Virtual Try-On(VTO) 기술은 증강현실(AR)과 인공지능(AI)을 기반으로 사용자가 실제로 옷을 입지 않고도 가상의 피팅을 경험할 수 있도록 하는 혁신적인 기술이다. 그러나 현재 상용화된 VTO 시스템은 이미지 왜곡, 색상 손실, 텍스처 변형 등의 문제로 인해 실제 제품과의 시각적 불일치를 자주 유발하며, 이로 인해 사용자 신뢰도와 만족도 저하의 주요 원인이 되고 있다. 본 연구는 이러한 문제를 정량적으로 분석하고 기술적 개선 방안을 제시하는 것을 목표로 한다. 이를 위해 실제 착용 이미지와 AI 로 생성된 가상 피팅 이미지 간의 유사도를 구조적 유사도 지수(SSIM), 신호대잡음비(PSNR), 딥러닝 기반 VGG16-Cosine 유사도 지표를 활용하여 비교·분석하였다. 특히, 상용 모델인 WeshopAI 를 활용한 실험에서는 50% 이하의 유사도를 보이는 사례가 다수 확인되었으며, 이는 생성된 이미지가 실제와 시각적으로 상당한 차이를 보인다는 점을 의미한다. 이러한 품질 저하는 AI 생성 알고리즘의 한계, 원본 입력 데이터의 왜곡, 해상도 저하, 색상 정확도 부족 등 복합적인 요소에서 기인하는 것으로 판단된다. 예컨대 의류의 질감이나 주름, 복잡한 패턴이 정확하게 반영되지 않고, 색상이 실제 제품과 달리 과장되거나 흐릿하게 표현되는 경우가 많았다. 이로 인해 소비자는 제품에 대한 오해를 가질 수 있으며, 이는 구매 전환율에도 부정적 영향을 미칠 수 있다. 따라서 본 논문의 기술적 접근은 VTO 기술의 실용성과 완성도를 동시에 제고하며, 궁극적으로는 온라인 사용자에게 보다 정확하고 신뢰할 수 있는 가상 서비스 환경을 제공할 수 있을 것이다.
-
본 연구는 메타 사의 이미지 분할 기본모델인 SAM의 이미지 인코더 부분의 구조 변경을 통해 기존 SAM의 성능을 개선하고자 한다. SAM의 이미지 인코더(Image Encoder)부분을 MAE-ViT(Masked Auto Encoder-Vision Transformer)모델에서 Swin Transformer 모델로 변경하여 기존 SAM모델에 비해 성능 차이는 없지만, 모델의 크기를 줄이는 연구를 진행하였다. 본 연구의 결과를 증명하기 위해 ImageNet-1K 데이터 셋으로 사전학습 된 두 가지 이미지 인코더 모델(MAE-ViT, Swin Transformer)에 대해 테스트 데이터로 학습을 진행하여 IoU(Intersection over Union) Score 측정방식을 이용해 성능을 평가하였다. 실험결과, 두 방식은 성능 측면에서는 유사했지만 본 연구에서 제안한 방식이 기존의 방식에 비해 모델 파라미터 수를 308.3(M)에서 92.0(M)으로 약 1/3배로 축소하는 효과를 얻었다.
-
본 연구에서는 메타(Meta)사의 SAM(Segment Anything Model)2의 제로 샷(Zero-Shot) 분할(Segmentation)성능을 유지하면서도 실시간 응용에 적합한 경량화 모델을 만들기 위해 증류(Distillation)기법을 적용하여 구축한 SAM2 학생(Student) 모델과 Ultralytics사의 최신의 실시간 분할모델인 YOLO(You Only Look Once)v12n-seg모델의 성능을 비교 평가하였다. 경량화한 SAM2 학생(Student) 모델은 기존의 파라미터 수를 38.97M(Million)에서 26.68M로 약 12.29M를 줄였다. 두 모델의 성능평가 실험 결과는 분할 마스크의 정확도는 경량화 SAM2가 약 2배 높았지만, 추론속도는 YOLOv12n-seg 모델이 약 3.5배 빨랐다.
-
본 연구는 MDLM(Masked Diffusion Language Model) 모델을 한국어 도메인에 적합하도록 한국어 데이터셋으로 사전훈련(Pre-training)하여 한국어 기반 확산언어모델(Diffusion Language Model)구현에 관한 연구이다. 한국어 도메인(Domain)으로 사전 훈련한 MDLM 모델과 AR(Autoregressive)기반 언어모델을 1024 토큰길이 32개의 샘플링 된 문장에 대해 GPTScore와 추론시간(Inference Time)의 2가지 측정지표로 성능평가를 진행하였다. 실험 결과 MDLM이 AR기반 언어모델보다 GPTScore가 약 6.5 낮지만 50과 100 샘플링 스텝(Sampling steps)에서의 추론시간은 각각 6.4[sec], 1.7[sec] 빠른 성능결과를 얻었다.
-
본 연구는 "boy on the left"처럼 한 줄짜리 자연어 지시만으로 특정 피사체를 선택하고, 선택된 영역에 한정해 사전 정의된 스타일(본 작업에서는 '리얼리틱 바비 인형' 스타일)을 적용하는 부분 인페인팅 파이프라인을 제안한다. 전체 흐름은 ① Grounded-SAM 기반 세그멘테이션 → ② Janus-Pro-7B 를 활용한 조건 프롬프트 확장 → ③ flux-1-fill-dev 를 이용한 인페인팅 및 블렌딩의 세 단계로 구성된다. ComfyUI 환경에서 각 노드를 연동해 실험을 수행했으며, 결과 이미지는 원본 배경과 라이팅을 유지한 채 대상 영역만 자연스럽게 변환되는 것을 확인하였다.
-
Guen Jin Ahn;Sungbum Park;Byung Seong Bae;Young Jin Kim 652
반도체 제조 장비는 화재, 부품 결함, 노후화 등의 다양한 요인으로 인해 예상치 못하게 가동이 중단되거나 정상적인 운용이 어려운 상황이 자주 발생한다. 이러한 장비의 고장은 반도체 생산 공정 전체를 중단시키며, 이에 따라 기업의 생산 효율 저하 및 원가 상승을 초래한다. 본 연구에서는 장비에 부착된 온도, 진동, 전력 센서로부터 수집된 시계열 데이터를 활용하여, Self-Attention 기반 Transformer 모델을 통해 반도체 제조 장비의 고장을 사전에 예측하고자 하였다. 제안하는 모델은 시계열 내 장기 의존성(Long-Term Dependency)을 효과적으로 학습함으로써, 기존 Auto-Encoder 기반 예측 모델 대비 정확도 향상을 목표로 한다. -
Byeong-Hoon Park;Ki-Hwan Kim;Jong-Ho Kim;Min-Su Son;Man-Su Byoun 655
본 연구는 Retrieval-Augmented Generation(RAG) 시스템에서 문서의 유형이나 도메인에 따라 사용자가 반복적으로 실험하지 않아도 최적의 문서 분할(Chunking) 전략을 자동으로 선택할 수 있는 LLM 기반 Agent를 제안한다. 이 Agent는 문서의 구조와 의미 흐름을 분석한 뒤, 미리 정의된 네 가지 전략(Page, Recursive, Semantic, Token-based) 중 가장 적합한 전략을 자동으로 선택하고 실행하도록 설계되었다. 실험은 한국어 산업 도메인 5개 분야의 문서를 대상으로 진행되었으며, 검색 결과 상위 5개의 문단 중 정답 문단이 포함된 비율은 평균 약 78.6%였으며, 전체 문서 중 약 72%에서 Agent가 가장 효과적인 전략을 선택하였다. 이러한 결과는 복잡한 실험 과정을 반복하지 않고도 전략 선택과 실행을 자동화할 수 있는 가능성을 보여주며, 다양한 문서 유형과 도메인에 적응 가능한 RAG 시스템 구현을 위한 기반 기술로 활용될 수 있음을 시사한다. -
본 논문은 Tree-of-Thought(ToT) 기반 질의 생성 프레임워크를 설계하여, NoSQL 데이터베이스에 대한 자연어 질의 변환의 해석 가능성과 구조적 완성도를 향상시키는 방안을 제안한다. 기존의 LLM 기반 방식은 일괄 생성(one-shot)에 의존하여 복잡한 구조 처리와 생성 과정의 설명에 한계를 보인다. 이를 보완하기 위해, 본 프레임워크는 질의를 사고 단위(thought unit)로 분해하고, 이를 트리 형태로 탐색함으로써 단계별 추론과 구조적 제어를 가능하게 한다. 논문에서는 기존 접근의 문제점을 분석하고, 설계 목표와 구조, 향후 확장 방향을 중심으로 프레임워크의 핵심 내용을 제시한다.
-
본 연구는 BLIP-2 구조를 폐렴 엑스레이(X-ray-Peneumonia) 이미지 도메인에 적합하도록 변경하여 폐렴 엑스레이 이미지 데이터의 캡셔닝(Captioning)성능개선에 관한 연구이다. 본 연구에서는 기존의 BLIP-2 모델의 이미지 인코더인 ViT(Vision Transfomer)모델을 폐렴 엑스레이 이미지 데이터로 전이학습을 수행하고, Q-former 경량화와 의료정보로 특화된 T5 언어 모델(LLM)을 적용하여 제한된 연산 자원에서의 효율적으로 동작하는 방식을 제안하였다. 제안한 방식의 성능측정을 위해 폐렴 엑스레이(X-ray-Peneumonia) 이미지 데이터에 대해 Accuracy, ROUGE-1, BLEU, METEOR 4가지 측정지표를 사용하여 성능실험을 수행하였다.
-
본 연구는 정책 질의 기반 생성형 BI(Generative Business Intelligence) 시스템 구현을 위해, 강화학습 기반의 Agentic RAG 구조를 설계하였다. 기존 RAG 시스템의 임베딩 유사도 기반 정적 검색 구조는 시계열 흐름, 비교 분석, 정책적 해석 등 고차원 질의 대응에 한계가 존재한다. 이를 극복하기 위해, 본 논문은 문서 구간 기반 의미 단위 세분화, 메타 태깅 기반 관계 그래프 저장, PPO 기반 보상 최적화, 자연어 응답 생성을 하나의 프레임워크로 통합하였다. 에이전트는 질의의 목적에 따라 동적으로 문서를 탐색하며, 보상 기반 정책 학습을 통해 최적의 인사이트를 반복적으로 선택한다. 본 연구는 현재까지 보고된 바 없는 구조적 설계를 통해, 정책 질의 기반 생성형 BI의 실현 가능성과 확장성을 제시하였다.
-
Jungju Woo;Min Sung;Yeyoung Cho;Jisuk Kang;Yong Seong Song;Yeongrak Choi 668
본 연구는 기업 내 데이터 보안 및 규정 준수 요구를 충족하는 인하우스 LLM 서비스 구축을 위해 오픈소스 프레임워크(Open WebUI, LiteLLM)를 활용한 효율적인 API 연동 아키텍처를 제안한다. 두퍼블릭 클라우드에서 제공하는 LLM API와의 연동 실험 결과, 직접 API 호출 대비 소폭의 응답 시간 증가를 보인 반면, GUI 기반 설정과 다중 API 추상화에 따른 관리 및 유지보수 효율성에 대한 장점을 보였다. 이러한 결과는 제안 아키텍처가 기업 환경에서 인하우스 LLM 서비스 구축에 효과적으로 활용될 수 있음을 시사한다. -
본 연구는 경량 디바이스의 데이터 처리를 위한 Dataset Characterization-Driven Feature Selection 방식을 제안한다. 실험 결과에 따르면, DC-DFS 가 선택한 특징 중요도 기반 특징 선택에서 종래의 정적 피처 선택 방식보다 약 10.32% 더 높은 정확도를 보였다.
-
FreeControl은 재학습 없이 다양한 조건에 따라 텍스트-이미지 생성을 제어할 수 있는 diffusion 기반 모델로, 포즈나 형태 등은 구조 가이던스, 스타일·색감·이미지 구도 등은 외향 가이던스를 통해 제어된다. 그러나 인물 생성 시 얼굴의 정체성(눈·코·입의 위치, 비율, 구도 등)을 유지하는 데 한계가 있으며, 배경이나 손 등 다른 시각적 요소와 혼재되어 얼굴 표현이 왜곡되는 문제가 발생한다. 이는 기존 가이던스만으로는 얼굴과 같은 정밀한 영역을 충분히 제어하지 못하고, 전경(foreground)에 대한 집중도가 낮기 때문이다. 본 논문에서는 얼굴 랜드마크 기반의 새로운 가이던스인 FLAG(Face Landmark-Aware Guidance)를 제안한다. FLAG는 참조 이미지에서 추출한 얼굴 랜드마크를 기반으로 피처의 일관성을 유지하도록 유도하며, Soft Attention Mask를 통해 얼굴 영역에 집중된 손실을 적용함으로써 자연스럽고 안정적인 인물 표현을 가능하게 한다.
-
본 연구는 이미지가 포함된 비정형 PDF 문서로부터 유의미한 정보를 추출하고, 사용자 질의에 대해 텍스트와 이미지 기반 응답을 생성하는 멀티모달 Retrieval-Augmented Generation (RAG) 시스템을 제안한다. 본 시스템은 OCR 기반 텍스트, 이미지 추출, 이미지 캡션 생성, 멀티모달 임베딩, 하이브리드 검색을 통합하여 설계 되었으며, Reciprocal Rank Fusion 과 Cross-Encoder 재랭킹을 통해 검색 품질을 향상시켰다. 실험 결과, 기존 단일 모달 방식보다 더 높은 응답 품질과 사용자 만족도를 보였으며, 답변의 출처를 제공함으로써 응답의 신뢰성과 투명성을 강화하였다. 본 연구는 멀티모달 AI 및 비정형 문서 처리 기술의 실용적 확장 가능성을 제시한다.
-
본 연구는 스테이블 디퓨젼(Stable diffusion)기술을 활용한 Prompt-to-Prompt 이미지 편집기술을 엣지 컴퓨터(Edge Computer), 라즈베리 파이5(Raspberry Pi5)에서 구현에 관한 것이다. 일반 데스크톱(Desktop) PC와 엣지 컴퓨터 환경인 라즈베리 파이5에서 생성된 각각의 이미지를 비교평가하기 위해 SSIM(Structural Similarity Index Measure)와 LPIPS(Learned Perceptual Image Patch Similarity) 지표를 통해 이미지 간의 유사도 평가와 이미지 생성 시간을 각각 비교 평가하였다. 라즈베리 파이5에서는 데스크톱 PC에 비해 이미지 생성 시간은 8.7배 걸렸지만, 생성된 이미지의 성능은 데스크톱 PC에서의 성능과 거의 유사한 실험 결과를 얻었다.
-
치매는 인지 기능이 점진적으로 저하되는 불치성 질환으로, 환자와 보호자 모두에게 심리적·정서적 부담을 안겨준다. 특히 환자가 가족을 인지하지 못하는 상황은 보호자에게 극심한 상실감과 우울감을 초래한다. 기존 회상 요법은 과거 사진이나 음악을 활용해 환자의 기억을 자극하지만, 정적인 자료만으로는 충분한 감정적 몰입을 이끌어내기 어렵다는 한계가 존재한다. 본 논문에서는 생성형 AI 기술을 활용하여 과거 사진을 동영상으로 변환하고, 상황에 맞는 음향을 재현함으로써, 몰입감 높은 회상 자극을 제공하는 방안을 제안한다. 이를 통해 치매 환자의 기억 회상 효과를 높이고, 보호자의 정서적 부담을 완화하는 데 기여하고자 한다.
-
Due to the increasing consumption in energy, accurate building energy prediction has become important, and recent studies achieve significant advancement with deep learning-based approaches. However, there are still some challenges. For accurate prediction, a complex structure that considers both temporal and spatial features must be applied, which makes it difficult to extend to other cases. Furthermore, some recent studies use simple time-series model as comparison, which may undermine the advantage of incorporating spatial features. In this paper, we propose novel Two-stage Spatiotemporal Prediction Module (TSPM) to overcome these limitations. Our TSPM can incorporate spatial features based on building floor plans images which can easily obtained. In addition, we conduct fair comparisons with promising time-series models to demonstrate effectiveness of our approach.
-
Plant leaf disease identification is essential to ensure that plant leaf diseases can be identified early, kept from spreading too far, and as a result it is essential to ensure less crop and therefore food waste during production. To train deep learning models capable of assisting workers in the process, datasets that are diverse, large, and high quality are needed but creating them is laborious. Fields, staff, equipment, hardware and experts are needed and make the creation even more difficult and not everyone has access to the means to create them. However, a true benchmark dataset in hybrid conditions would greatly help the field, so in this paper we introduce a methodology to combine, augment, balance, etc. open datasets to create a new dataset with over 300,000 images across 80 classes called PLDC-80. The dataset methods are available at: https://github.com/JDatPNW/PLDC-80
-
본 연구는 구글(Google)의 최신 언어 모델인 Gemma3를 Raspberry Pi5와 같은 엣지 컴퓨팅 환경에서 효과적으로 활용하기 위해 모델의 경량화 및 성능 최적화 수행에 관한 연구이다. 본 연구에서는 기존의 Gemma3-4B-IT 모델에 양자화(Quantization) 기법을 적용하여 모델의 크기를 축소하였고, 제한된 리소스 환경에서도 우수한 성능을 유지할 수 있음을 실험결과를 통해 증명하였다. 성능 평가는 Raspberry Pi5 환경에서 경량화를 수행한 제안 모델과 기존 Gemma3-4B 모델을 비교 평가하였으며 성능 평가방식은 ROUGE-1, BLEU, METEOR의 세 가지 정량적 측정지표와 질의에 대한 답변을 통한 정성적인 평가를 진행하였다.
-
Seongmin Han;Jonghwa Shim;EunBeen Kim;Eenjun Hwang 693
건축 설계의 초기 단계에서는 발주자와 설계자 간의 의사소통을 돕고 설계 업무의 효율성을 증대시키기 위해 요구사항이 유사한 평면도를 검색한다. 기존의 평면도 검색 시스템은 방의 유형, 개수, 면적과 같이, 제한적으로 입력된 메타데이터의 일치 여부만으로 평면도를 검색하기 때문에, 방 간의 연결관계나 위치 관계와 같은 공간의 의미론적인 특성을 반영하여 검색하지 못한다. 이러한 문제를 해결하기 위해, 본 논문은 평면도를 분석하여 방의 개수, 연결 관계, 위치 관계를 포함한 공간 구성 텍스트 데이터를 자동으로 생성하고, 이미지 임베딩 모델과 텍스트 임베딩 모델을 미세 조정하여, 공간 구성 텍스트의 의미론적인 특성을 반영할 수 있는 텍스트 조건부 평면도 검색 기법을 제안한다. 또한 방의 개수와 같은 수량 정보에 대한 검색 성능을 향상시키기 위해 임베딩 모델을 미세 조정하는 단계에서 개수 측정 손실 함수를 함께 적용하였다. 비교 실험 및 절제 연구 결과, 제안 기법은 기존 방법보다 검색 성능이 최대 54% 향상되었으며, 개수 측정 손실 함수를 적용한 경우에는 검색 성능이 최대 8.41% 추가로 개선되었다. -
Reinforcement Learning Optimization for Lightweight VLMs via CoT and LoRA : A Case Study in GymCardsVision-Language 모델(VLM)은 시각적 환경과 자연어 지시의 결합을 통해 강화학습(RL)의 성능을 높일 수 있으나, 대규모 모델 적용 시 막대한 계산 자원과 메모리 제약이라는 어려움이 있다. 본 연구는 경량 VLM 인 SmolVLM 에 파라미터 효율적 파인튜닝(LoRA)과 명시적 추론(CoT)을 결합하여 효율적인 RL 에이전트를 제안한다. GymCards 환경에서 Proximal Policy Optimization(PPO)으로 에이전트를 학습하고 정책 생성 과정에 CoT 를 통합해 성능과 해석 가능성을 높였다. 실험 결과, 제안된 SmolVLM-CoT-LoRA 모델은 CoT 가 없는 SmolVLM-LoRA 와 제로샷 평가 대비 우수한 성능과 효율성을 보였으며, CoT 의 효과성과 RL 파인튜닝의 필요성을 확인했다. LoRA 는 제한된 GPU 자원에서도 효과적인 학습을 가능하게 하였으며, 본 연구는 자원 제약 환경에서 실용적이고 효과적인 경량 VLM 기반 RL 접근법을 제시한다.
-
본 연구에서는 모바일 기기 내에서 동작 가능한 RAG(Retrieval-Augmented Generation) 및 그래프 기반 RAG(Graph RAG)의 검색 및 프롬프트 생성 시스템을 구현하였다. 본 연구에서 제안한 시스템을 평가하기 위해 동서울대학교 컴퓨터소프트웨어학과 학과 소개 페이지로 도메인을 한정하여 실험을 진행하였다. 제안한 시스템의 성능 평가를 위해 F1 Score, BLEU, ROUGE-L, Answer Similarity, 프롬프트 생성 시간, 추론 시간(inference time)의 총 6가지 방법으로 각 시스템을 평가하였으며, 제안한 두 시스템의 비교평가 결과 그래프 기반 RAG 시스템에 비해 RAG 시스템이 각 평가지표에서 0.24, 0.087, 0.209, 0.27, -0.014초, -1.793초 만큼의 개선된 성능을 보였다.
-
게임 인공지능은 강화 학습(Reinforcement Learning), 생성형 인공지능(Generative AI), 대규모 언어모델(LLM) 등의 기술 발전과 함께 점점 복잡한 환경에서도 적응하고 학습하는 방향으로 발전하고 있다. 인공지능은 다양한 영역에서 활용되며 게임의 설계, 개발, 운영 전반에 있어 핵심 기술로 자리잡고 있다. 본 논문에서는 게임 AI의 발전 과정을 조사하고 주요 기술의 적용 방식과 특성을 분석한다.
-
Parkinson's Disease (PD) affects speech in measurable ways, yet most existing models rely on numerical features, limiting interpretability and adaptability for language-based analysis. To address this, we convert structured speech features into clinically meaningful textual symptom descriptions and leverage Sentence-BERT (S-BERT) for PD classification. To improve model robustness and diversity, we apply textual augmentation techniques including synonym replacement, random deletion, word swapping, and named entity substitution. Our augmented S-BERT model achieved an accuracy of 85.0%, outperforming the non-augmented baseline at 82.3%. This approach demonstrates the effectiveness of language-driven representations in speech-based PD detection and highlights the value of augmentation in enhancing transformer-based medical diagnostics.
-
본 연구는 약물 부작용 예측의 정밀도 향상을 목표로, 약물 구조 정보, 부작용 텍스트 표현, 그리고 약물 처리에 따른 유전자 발현 데이터를 통합하는 다중 데이터 융합 접근법을 제안한다. 이질적인 정보를 통합해 입력 데이터로 구성한 후, 단일 예측 모델을 구축하고 특정 약물에 따른 부작용 발생 여부를 예측하는 딥러닝 모델을 개발했다. 특히, 다양한 데이터 조합을 통해, 모델 성능을 체계적으로 비교 분석하여, 각 데이터들이 약물 부작용을 예측에 미치는 영향을 분석했으며, 이를 통해 유전자 발현 데이터의 통합이 부작용 예측 성능에 중요한 영향을 미치는 것을 확인했다.
-
약물 간 상호작용(Drug-Drug Interaction, DDI)은 병용 약물 사용 시 발생할 수 있는 예기치 못한 약리학적 반응으로, 환자의 안전과 치료 효과에 중대한 영향을 미친다. 본 연구에서는 약물 설명 텍스트, 화학 구조, 생물학적 네트워크를 통합한 멀티모달 모델을 통한 약물 표현을 기반으로 79 가지 DDI 유형을 예측하는 모델을 제안한다. 다양한 이질 데이터를 통합한 멀티모달 딥러닝 모델을 구성하여 다중 분류 모델을 학습했고, 기존 모델 대비 예측 모델의 성능 향상을 확인했다. 제안된 방법은 약물의 의미적, 화학적, 생물학적 특징을 함께 반영함으로써 잠재적 DDI 의 사전 예측 가능성을 향상시키며, 새로운 약물 조합에 대한 DDI 탐색에도 기여할 수 있다.
-
Steel surface defect classification is important in producing an optimal product. However, worker errors while classifying the metal surface can lead to issues in production. So, recently researchers found a way to invest more in Industry 4.0 technology with methods such as Convolutional Neural Networks (CNNs). But models can be too large to be implemented in the factory. In response, we proposed a tiny model called SSDC-MiniNet with only 23,588 parameters and 0.105 GFLOPS. The model was trained on the North Eastern University (NEU) dataset, which consists of 1,800 images of six common metal surface defects. After testing the model, we achieved a competitive accuracy of 98.67% with only around 1% of the parameter count and flops.
-
Dhivyaa S P;Hyung-Jeong Yang;Jahae Kim;Myungeun Lee 715
Accurately modeling the progression of Alzheimer's disease (AD) is critical for timely intervention and treatment planning. However, longitudinal clinical data used for such prediction often suffer from irregular sampling and missing values, limiting the effectiveness of traditional machine learning approaches. In this study, we propose ADxPro-T, a novel end-to-end framework that combines a mask-aware LSTM for imputing and prediction of next timepoint data along with a Transformer encoder-decoder for long-range prediction from a single baseline visit. ADxPro-T jointly performs diagnostic prediction and biomarker imputation, leveraging temporal patterns even in the presence of sparse data. Evaluated on the ADNI dataset, our model outperforms state-of-the-art baselines including GRU-D, MinimalRNN, and BiPro, in both classification and imputation tasks. Further, an ablation study confirms that incorporating baseline diagnosis significantly enhances predictive performance. These results establish ADxPro-T as a robust and effective model for early-stage AD progression prediction in real-world clinical settings. -
Anjitha Divakaran;Hyung-Jeong Yang;Seungwon Kim;Ji-eun Shin;Soo-Hyung Kim 719
Emotional connection is essential in mental health support, especially in text-based applications where users seek empathy and validation. TalkThru is an AI-powered mobile app designed to provide real-time emotional assistance through personalized conversations and self-care tools. By combining DistilBERT for emotion detection with T5 for empathetic response generation, the system ensures context-aware interaction that resonates with user emotions. A dynamic avatar, which evolves with the user’s emotional journey, adds visual engagement. The app also includes journaling, mood tracking, meditation, and music therapy, supported by gamification to encourage consistency. Developed using Kotlin and Flask, TalkThru maintains performance and scalability while securing sensitive emotional data. Initial evaluations show promising accuracy in emotion recognition and user satisfaction, positioning TalkThru as a practical, AI-driven solution for digital mental health care. -
NeRF 는 고품질 view synthesis 를 가능하게 했지만, 모든 좌표별 속성을 MLP 가 직접 학습해야 하므로 학습 속도가 느리다는 단점이 있다. 이를 보완한 Instant-NGP 는 해시 인코딩을 도입해 학습 속도를 개선했으나, 입력으로 절대 좌표만을 사용해 구조적 관계를 학습하기 어렵다는 한계가 있다. 본 연구는 이를 개선하기 위해 Instant-NGP 의 입력에 상대 좌표를 추가하는 방식을 제안한다. 상대 좌표는 구조적 연관성을 반영할 수 있도록 평균 위치를 기준점으로 계산되며, 기존 인코딩과의 스케일 차이를 보정해 두 입력이 균형 있게 학습되도록 한다. 실험 결과, 제안한 방법은 LPIPS 지표에서 우수한 성능을 보이며, 구조 복원과 노이즈 제거 측면에서 유의미한 개선을 나타냈다.
-
Seohyeon Hong;Yoonseo Choi;Nayoung Kim;Jungyeon Lee;Hyon Hee Kim 725
본 연구는 여행객의 감성을 반영한 관광지 추천 프레임워크를 제안한다. 감성 프로필은 PCA 기반 벡터로, 관광지는 koCLIP 멀티모달 임베딩으로 표현되며, 양방향 크로스 어텐션 구조를 통해 감성 공간에서 정렬된다. 제안 모델은 콜드 스타트 상황에서도 높은 예측 성능과 추천 결과의 감성 다양성을 달성하였다. -
최근 인공지능 기술이 다양한 분야로 확산되면서 사용자 디바이스에서 인공지능 모델을 학습시키는 온디바이스 학습 기술이 주목받고 있다. 이는 로컬 환경에서 데이터를 수집과 모델 학습을 모두 수행함으로써 개인정보의 노출 방지와 네트워크 지연 최소화를 가능케 한다. MCU 기반 Edge 디바이스에 지속적인 동작이 가능한 인공지능 모델을 탑재하기 위해서는, 저장공간 제약과 전원의 차단과 복귀가 반복적으로 발생하는 디바이스의 동작 특성을 고려한 프레임워크의 설계가 필요하다. 본 연구에서는 이와 같은 조건을 만족하도록, 모델의 연속적인 학습이 가능하며 하드웨어 이식성이 있는 비휘발성 메모리 활용 인공신경망 프레임워크를 구현하고, 실험을 통해 전원 차단 이후에도 세션이 지속적으로 유지되고 모델 검증 절차가 정상적으로 동작함을 확인하였다.
-
Jun-Ik Ma;Se-In Lee;Chan-Wook Jeon;Se-Hwan Moon;Sang-Yoon Kim;Kyung-Woon Lee;Jung-Hoon Cho 731
본 논문은 엣지(Edge) 환경에서 인공지능 모델의 추론 성능 최적화를 위한 병렬 연산 전략을 분석하였다. 성능이 상이한 세 가지 엣지 디바이스(Jetson Nano, Jetson Orin Nano, Jetson AGX Orin)와 총 6가지 대표 인공지능 모델(DNN, LSTM, GRU, AlexNet, MobileNet, ResNet)을 대상으로, 멀티코어 CPU 사용 개수 및 GPU 메모리 용량 제한을 독립 변수로 설정하여 실험을 수행하였다. 실험 결과, 재귀적 특성이 강한 모델(LSTM)은 멀티코어 CPU 활용 효과가 제한적이었고, CPU 코어 수 증가에 따른 성능 향상은 4개 이상의 코어부터 둔화되었으며, GPU 메모리 과다 할당은 오히려 성능 저하를 초래하는 것으로 나타났다. 이를 통해 모델 특성에 따른 최적 병렬화 전략 설정이 필수적이며, 무분별한 자원 증가는 오히려 비효율을 초래할 수 있음을 확인하였다. 본 논문은 엣지 디바이스 환경에서 인공지능 모델을 효율적으로 운용하기 위한 병렬 연산 설정에 있어, 단순한 자원 증가가 아니라 모델 특성에 따른 세밀한 최적화 전략이 필수적임을 실험적으로 입증하였다. -
Obstructive Sleep Apnea (OSA) is a common but often underdiagnosed sleep disorder, partly due to the failure to consider differing dominant symptoms between sexes. While polysomnography (PSG) remains the diagnostic gold standard, it is resource-intensive and impractical for large-scale screening. To improve accessibility, clinicians have developed self-reported sleep questionnaires. This study investigates whether Large Language Models (LLMs) can classify OSA severity using only demographic and questionnaire features, without model training or access to PSG-derived metrics. Using data from 1,098 patients in the APPLES dataset, we evaluate two prompting strategies: a basic zero-shot role-based prompt (P1) and an enhanced three-shot prompt incorporating chain-of-thought (CoT) reasoning and sex-specific feature importance (P2). The P1 baseline underperforms compared to traditional machine learning models. However, P2 substantially improves LLM performance, achieving accuracy comparable to a Random Forest classifier. These findings highlight the critical role of prompt design in unlocking the diagnostic potential of LLMs and suggest that well-engineered prompts, even with only a few labeled examples, can provide a low-cost, interpretable, and sex-aware alternative for OSA severity classification.
-
Jo Vianto;Sun-ja Yeom;Myeong-Eun Lee;Hyung-Jeong Yang 739
Brain tumour diagnosis using Magnetic Resonance Imaging (MRI) is often challenged by the limited spatial resolution of clinically acquired scans. This limitation hampers accurate tumour boundary delineation, crucial for treatment planning and monitoring. While separate deep learning models for brain tumour segmentation and super-resolution (SR) have shown progress, handling both tasks independently leads to inefficiencies. To address this, we propose SwinSR-UNETR, a novel multi-task learning framework that jointly performs segmentation and SR on 3D MRI volumes. Built on a modified Swin UNETR backbone, our model shares a transformer-based encoder while employing task-specific decoders, enhancing both spatial detail and semantic understanding. A task-aware uncertainty loss balances optimization between segmentation and reconstruction objectives. Extensive experiments on the BraTS-GLI 2023 dataset demonstrate that SwinSR-UNETR improves both segmentation accuracy and super-resolution quality, outperforming traditional baselines on low-resolution inputs. Our results highlight the effectiveness of unified learning in addressing the challenges of low-resolution MRI-based tumour assessment. -
컴퓨터 비전 분야에서는 모델의 성능 개선을 목적으로 다양한 최적화 기법이 제안되어 왔으나, 대부분 고정된 아키텍처 내에서의 하이퍼 파라미터 조정에 국한되었기 때문에 유연한 구조 설계를 진행하는 데 한계가 있었다. Neural Architecture Search (NAS)는 신경망 구조 자체를 탐색의 대상으로 삼는 자동화 기반의 접근으로, 구조적 최적화 측면에서 기존 방식과의 차별화를 이룰 수 있는 가능성을 제시한다. 본 논문은 NAS의 핵심 구성 요소인 탐색 공간(Search Space), 탐색 전략(Search Strategy), 성능 예측 기법(Performance Estimation Strategy)을 중심으로 이론적 기초를 정리하고, 이를 기반으로 최근 연구 동향을 체계적으로 분석한다. 특히, NAS 기반으로 설계된 아키텍처들이 컴퓨터 비전 과제별로 어떤 구조적 특성과 설계 전략을 통해 기존 수작업 모델 대비 성능 향상, 연산 효율 개선, 표현력 확장 등을 실현했는지를 구체적인 사례 분석과 수치 기반 비교를 통해 고찰한다. 이를 통해 NAS가 단순한 설계 자동화 도구가 아닌, 도메인 특화 최적화 수단으로서 갖는 이론적 정당성과 실용적 가치를 동시에 재조명한다.
-
Recent advancements in Large Language Models (LLMs) have led to the active development of multi-agent systems (MAS) for collaborative problem-solving. This paper provides a comprehensive review of MAS structures and applications, focusing on two recent frameworks-CodeAgent and MetaGPT-that leverage LLMs in complex software engineering tasks. Through detailed examination of their design and workflows, we identify the strengths and limitations of each system and propose future directions to improve the adaptability and scalability of MAS frameworks while addressing their reliability challenges.
-
AI 모델 개방의 긍정적인 효과와 요구에 따라 AI 모델의 개방성 평가도 중요시되고 있다. 기존 AI 모델 개방성 평가는 수작업으로 진행되어 많은 시간과 노력을 요구한다. 본 논문에서는 모델 개방성 평가를 자동화하는 에이전트 기반 AI 모델 개방성 평가 시스템 아키텍쳐를 제안한다.
-
본 연구는 LLM 기반 에이전트 시스템의 자동화된 워크플로우 생성을 탐색하고 서로 다른 방식의 대표 프레임워크인 AFLOW 와 FLOW 를 비교 분석하였다. 실험을 통해 두 방식 모두 높은 자동화 성능을 달성하였지만 실행 환경에서의 통합성과 검증 절차 부족이라는 한계를 확인하였다. 이를 보완하기 위해 Java Spring Boot 기반의 실행 실험을 수행하였고 자동화된 구조 생성과 실행 검증이 가능함을 입증하였다. 본 연구는 향후 실행로그 기반 워크플로우 개선을 포함한 실용적 자동 워크플로우 설계 방향을 제시한다.
-
최근 인공지능, 빅데이터 분석 등 데이터 기반 애플리케이션이 빠르게 발전함에 따라, 잦은 메모리 접근으로 인한 메모리 병목 현상이 중요한 문제로 대두되고 있다. 이를 해결하기 위한 방안으로 메모리 내에서 연산을 수행하는 Processing-in-Memory (PIM) 아키텍처가 주목받고 있지만, 병렬 처리를 전제로 한 구조적 특성으로 인해 실제 활용에는 어려움이 따른다. 본 논문에서는 PIM 장치를 효율적으로 활용하기 위한 데이터 이동량 정적 분석 기반 병렬화 알고리즘을 제안한다. 제안하는 알고리즘은 연산을 최소 단위로 분할한 후, 데이터 이동량 기반의 비용 함수를 통해 각 타일의 비용을 정량적으로 분석한다. 이를 바탕으로 병렬화 수준을 자동으로 결정하며, UPMEM PIM 서버에서의 실험을 통해 제안 알고리즘이 도출한 병렬화 수준이 실제 최적의 수준과 유사함을 확인하였다.
-
Nita Li;Seyha Heng;Lay Seng;Jihyun Moon;Sokkhey Phauk;Charmgil Hong 758
Khmer language processing faces significant challenges due to limited resources, making it difficult to build effective AI systems. This study proposes a privacy-focused Khmer chatbot using a Retrieval-Augmented Generation (RAG) framework, designed to operate entirely within secure infrastructures without exposing sensitive data to external servers. A local FAISS-based database stores internal documents, enabling accurate and private retrieval. We evaluated five pre-trained large language models (LLMs) and two embedding models to select the optimal configuration for Khmer question answering. The final system improves both response accuracy and information privacy, providing a scalable solution for private organizations and contributing to Cambodia's digital transformation. -
Static analysis tools such as Joern can scale to large codebases, yet their purely structural reasoning often yields low precision and recall on real-world vulnerabilities. Recent large language models (LLMs) excel at code understanding, but retraining such models is costly and time-consuming. We present a training-free hybrid pipeline that couples Joern with prompt-based inference from GPT-4.1-nano. After a static scan, functions are routed to the LLM based on Joern's risk score, and their predictions are merged via one of three rule-based strategies. On the Big-Vul dataset, our hybrid more than doubles recall and F1 over Joern, while also improving precision - all without updating model weights. While it still trails fine-tuned models like CodeBERT, the proposed method provides a practical and deployable enhancement for vulnerability detection when full fine-tuning is infeasible. Future work will embed graph-based context and explore ensembles that marry LLM adaptability with structure-aware precision.
-
본 연구는 Vision-Language Model(VLM)의 세분화된 hallucination 오류를 완화하기 위한 Direct Preference Optimization 기반 정렬 학습 기법을 제안한다. 사전 학습된 VLM이 생성한 이미지 캡션을 GPT-4o를 활용하여 명사구 단위로 분해하고, 각 명사구의 객체 및 속성 정보를 추출한 뒤 시각적 정합성을 평가하여 선호-비선호 응답 쌍을 생성한다. 생성된 응답 쌍은 별도의 보상 모델 없이 DPO 학습에 활용된다. COCO 2014 데이터셋을 기반으로 한 실험 결과, CHAIR 및 FaithScore 지표 모두에서 기존 대비 향상된 성능을 보였으며, 객체 및 속성 수준의 hallucination 완화 효과를 보였다. 이를 통해 제안하는 정렬 학습 기법이 VLM의 신뢰성을 향상시키는 데 효과적임을 보여준다.
-
Ji-Hun Kim;Jong-Ho Lee;Ji-Eun Lee;Young-Tae Shin 770
본 논문은 AI 모델의 무단 학습으로 인한 저작권 침해를 방지하기 위해, 강화학습 기반 적대적 워터마크 생성 기법을 제안한다. 에이전트는 이미지에 인간이 인식하기 어려운 노이즈를 삽입하여, 학습 모델의 성능을 저하시킬 수 있는 워터마크를 학습한다. 보상 함수는 공격 성공률(ASR)과 시각 유사도(SSIM)를 동시에 고려하며, 반복 학습을 통해 은밀하고 효과적인 워터마크를 생성한다. -
Traditional object detectors such as YOLO and Faster R-CNN are limited to fixed category labels and struggle with novel or unseen objects. Open-vocabulary models like CLIP offer greater flexibility but often misinterpret user intent due to a lack of commonsense reasoning. To address these limitations, we propose a commonsense-guided open-world object detection framework that integrates YOLOv8 for fast region proposals, CLIP for visual-text alignment, LLaVA for scene understanding, and GPT-4 for trait-based reasoning. By pre-generating over 100 object descriptions with GPT-4, our system embeds functional and contextual knowledge that enables intent-aware detection beyond static labels. Experiments on COCO, Open Images, and a custom dataset of unseen objects demonstrate that our approach significantly improves recall on novel queries while maintaining high precision. These results highlight the importance of combining vision-language models with commonsense reasoning for open-world detection. For implementation details, https://github.com/ibrohimgets/CommonsenseVision.git
-
본 연구는 원격 로봇 제어를 위한 역할 기반 XR 인터페이스를 제안한다. 작업자와 전문가의 두 사용자는 확장 현실 작업 공간을 실시간으로 공유하며, 각자의 역할에 맞게 설계된 인터페이스를 통해 협업하여 정밀한 로봇 조작을 수행한다. 본 논문은 역할에 따른 인터페이스 차별화가 사용자간 상호작용의 원활성과 작업 수행의 효율성, 나아가 XR 기반 협업 시스템의 확장 가능성에 어떠한 기여를 하는지를 살펴본다.
-
Byung-Jin Song ;Hyeon-Bae Choi;Sol Ban;Ji-Kyun Yoo;Gyeng-Tae Kim 781
본 연구는 디지털 기술의 융합을 통해 전시 공간의 설계 및 운영 방식을 혁신하는 방법을 고찰하였다. 특히 VR(Virtual Reality), AR(Augmented Reality), 인터랙티브 미디어와 같은 실감형 콘텐츠 기술을 중심으로, 관람객의 몰입도와 체험 만족도를 극대화하는 전시 설계 및 운영 전략을 제시하였다. 연구 방법으로는 문헌 조사 및 국내외 주요 전시 사례 분석을 병행하였으며, 이를 통해 공간 기반 데이터 설계, 사용자 참여형 인터랙티브 기술 구현, 클라우드 기반 실시간 운영 관리 체계를 중심으로 한 전략적 접근 방안을 도출하였다. 또한, 스마트 전시관 구축을 위한 통합형 아키텍처와 단계별 기술 적용 로드맵을 제안하였다. 본 연구는 디지털 기술을 활용한 차세대 전시 공간 구현에 실질적인 가이드를 제공하고 있으며, 향후 AI, 디지털 트윈, 메타버스 등 차세대 기술과 연계한 전시관 운영 고도화 방향에 대한 기초 연구로서 의미를 가진다. -
Gyubin Oh;Juwon Seo;Taegeon Lee;JeongTae Park;Youngjong Kim 786
본 논문은 Unity 6 기반의 2D 로그라이크 게임을 개발한 사례를 다룬다. 로그라이크 장르는 높은 리플레이 가능성과 무작위성을 핵심으로 하며, 본 연구에서는 이에 부합하는 던전 맵 생성 시스템을 중심으로 게임을 설계하였다. 절차적 생성 알고리즘은 매 플레이 시 새로운 맵 구조와 이벤트를 생성하여 반복적인 게임 경험의 단조로움을 극복하고자 하였으며, 사용자는 탐험을 통해 스테이지를 진행하게 된다. Unity 6 엔진의 2D 기능과 C# 기반 스크립팅을 활용하여, 적 AI, 무기 시스템 등 다양한 요소를 통합 구현하였다. -
Jihyun Lee;Joohyun Jung;Junseok Kim;Youkyoung Ha;Hakyeon Kim;Youngjong Kim 788
본 연구는 사용자가 입력한 영상 및 문서 콘텐츠의 텍스트 데이터에서 사용하는 어휘를 추출하여 해당 어휘 목록을 중요도, 빈도 순으로 정렬 및 사용자에게 필요한 단어 순서로 학습할 수 있게 함에 따라 사용자가 효과적으로 외국어를 학습할 수 있도록 제공하는 방법에 대한 것이다. -
Byeong-uk Jo;Jeong-hee Kim;Jun-min Lee;Seong-hun Kim;Tae-hun Gong;Sobirov Ikboloy;Han-xu Yang;Sejin Park 790
미션 어플리케이션에서의 WebRTC 도입을 위한 실시간 통신 성능 비교 분석 논문으로 NAT(Network Address Translation)에서 연결 시간 평균 270ms, 동일 네트워크에서는 50ms로 기록되었고, 비트레이트 부분에서는 NAT이 2,000,000 bps, 동일 네트워크가 1,700,000bps로 기록되었다. 패킷 손실은 NAT 0.4%, 동일 네트워크 0.1%로 기록되었으며, 수신 지터는 NAT 17ms, 동일 네트워크 14ms로 기록되었다. 이 처럼 동일 네트워크보다 NAT이 공간적 제약이 덜하지만 성능의 저하가 있어 이를 보완하는 연구가 필요하다. -
자기보고식 연구에 기반을 둔 기존의 감정표현불능증 진단은 주관적 편향과 일관성 문제로 인해 근본적인 한계를 갖는다. 이를 극복하기 위해 본 논문에서는 텍스트, 음성, 실시간 표정 분석을 통합하여 환자의 정서 상태를 객관적으로 평가하는 방법을 제안한다. 특히 대규모 언어 모델 기반 가상 인간이 지원하는 상담 환경을 Unity 상에서 구현하였으며, 가상 인간은 표정, 제스처, 음성을 재현하여 사용자가 정서를 인지하고 표현하는 과정을 돕는다. 또한, DSM-5 기준에 따라 9가지 우울 레이블 및 그 강도를 산출하는 EmoDep 모듈과 실시간 얼굴 인식 모듈을 연계하여 자기보고의 편향을 줄이고 정교한 감정 데이터를 제공한다. 본 연구를 통해 정량화된 지표와 비언어적 상호작용을 결합함으로써 감정표현불능증의 정서인식 및 표현 능력을 향상시킬 수 있는 실질적 가능성을 확인하였다.
-
Dongjae Kim;Byungcheol Kim;Geunchan Park;Wonjoo Lee;Youngjong Kim 797
본 연구는 Z세대의 디지털 네이티브 특성과 사회 참여 동기를 고려한 새로운 봉사활동 플랫폼을 제안한다. 현재 1365와 같은 기존 봉사활동 플랫폼은 복잡한 인터페이스와 낮은 모바일 최적화로 Z세대의 사용성이 떨어진다. 이에 본 연구는 토스와 같은 현대적 금융 앱의 UI/UX 원칙을 적용하고 포인트 제도를 도입한 플랫폼을 설계했다. 미니멀리즘과 직관적 네비게이션, 위치 기반 서비스, 그리고 게이미피케이션 요소를 통합한 플랫폼은 Z세대의 개인적 성장 욕구를 충족시키며 봉사활동 참여의 지속성을 높일 것으로 기대된다. -
Jun-Hyeong Kim;Jae-Hoon Song;Jeong-Hoon Yun;Gon-Woo Lee;Jae-Yong Cho;Myeong-Hoon Jeong 799
본 논문은 GitHub 데이터와 설문을 활용한 AI Agent[1]기반의 SW 개발자 역량 평가 시스템을 제안한다. Chain of Thought 기법이 적용된 AI Agent 와 합당한 평가 기준을 바탕으로 체계적인 평가를 제공한다. 평가 프로세스의 정밀도와 신뢰성을 높이고, AI 기반의 답변 검증 과정을 도입하여 평가 결과의 객관성을 확보할 수 있다는 점을 시사한다. -
Minjae Kang;IJeong Ko;Hyeonsung Kwon;Leem Jeong yeop;Youngjong Kim 801
본 논문은 위치 기반 경로 추천 기능과 SNS 기능을 융합한 웹 기반 소셜 네트워크 서비스인 RouteMate 의 설계 및 구현에 대해 다룬다. RouteMate 는 사용자에게 음식, 카페, 오락, 숙박 등 다양한 장소의 정보를 제공하고 이를 조합하여 코스를 짜 공유할 수 있는 SNS 를 목표로 한다. RouteMate 는 사용자 맞춤 코스 추천과 SNS 기능을 결합함으로써, 사용자 경험을 극대화한다. 본 연구에서는 시스템의 주요 구성 요소와 기능, 기술적 구현 방식, 그리고 기대 효과를 제시하며, 현재까지의 개발 진행 상황과 향후 발전 방향에 대해 논의한다. -
SinYeong Kang;Ji-Seong Kim;KyungHwan Bang;Seonyong Lee;Hangi Choi;Youngjong Kim 803
본 논문은 Microsoft Office 사용 중 반복적인 마우스 입력을 감지하여, 해당 동작에 대응되는 단축키를 실시간으로 안내하는 프로그램을 제안한다. 또한 사용자의 입력 로그를 기반으로 단축키 사용 통계 리포트를 제공함으로써, 단축키 학습과 작업 효율 향상에 기여한다. -
본 연구는 사용자 입력을 기반으로 이종 다수 로봇의 제어를 지원하고, ROS 연동을 통해 실제 로봇 시스템으로 확장 가능한 XR 기반 로봇 시뮬레이터를 제안한다. 제안된 시스템은 UI 기반의 로봇 선택 및 전환 기능, 다중 로봇 제어 기능을 제공하며, 로봇 모델 및 시뮬레이션 환경의 유연한 추가와 확장이 가능하다. 이를 통해 기존 로봇 시뮬레이터의 제한된 범용성과 확장성 문제를 개선 하였다. 본 연구는 XR 환경에서 로봇 시뮬레이션의 유효성과 확장 가능성을 입증하고, 다양한 로봇 제어 시나리오에 대한 실험적 적용 가능성을 제시한다.
-
Young-Seo Park;Yeon-Woo Cho;Hye-Min Jo;Yeon-Woo Ji;Seok-Bong Yoo 807
현재 무인단말기는 대부분 터치 기반의 입력 방식에 의존하고 있으며, 이는 손의 사용이 제한된 사용자나 위생이 중요한 환경에서 불편함과 감염 위험을 초래한다. 이에 본 연구는 시선 추적 방식의 비접촉형 무인단말기 시스템을 제안한다. 동공 중심 특징 벡터와 시선 보조 특징 벡터를 활용하여 높은 정확도와 실시간성을 기대할 수 있는 딥러닝 기반 시선 추적 모델의 활용 가능성을 설계차원에서 제시한다. 또한 시선 유지 방식의 입력을 지원하는 사용자 인터페이스와 고대비 디자인, 음성안내, 시각적 피드백 요소를 포함한 사용자 경험 요소를 설계한다. 본 시스템은 무인단말기, 백오피스, 백엔드 서버로 구성된 구조를 갖춘다. 이를 통해 접촉 기반 인터페이스의 물리적 제약을 해소하고, 다양한 사용자 환경에서의 접근성과 조작 효율성을 향상시킬 수 있다. -
본 연구는 원주시에 거주하는 독거노인을 대상으로 ICT 기반 커뮤니티케어서비스에 대한 복잡성, 인지된 위험, 혁신 저항이 이용 의도에 미치는 영향을 분석하였다. 회귀분석 결과, 복잡성과 혁신 저항은 이용 의도에 유의한 부정적 영향을 미친 반면, 인지된 위험은 통계적으로 유의하지 않았다. 다중공선성 검토 결과 VIF 값이 허용 범위 내에 있어 모형의 신뢰성도 확보되었다. 본 연구는 고령층 ICT 서비스 수용을 높이기 위한 정책적·실천적 방안을 제시하는 데 의의가 있다.
-
Min-Jae Kim;Hwan-Hee Kim;Yu-Yeong Do;Da-Hyun Woo;Young-Jong Kim 814
본 논문은 사용자가 작성한 일기를 기반으로 감정을 분석하고, 그에 맞는 음악을 추천하는 "플레이리스트 공유 SNS 플랫폼" 인 Mu:d 를 제안한다. 최신 웹 기술(Next.js, React)을 활용하여 개발되었으며, 외부 LLM 기반 감정 분석 API 및 음악 데이터베이스 API 와 연계를 통해 정밀한 음악 추천 기능을 구현한다. 이를 통해 사용자는 자신의 감정을 반영한 음악을 쉽게 접하고 공유할 수 있으며, 정서적 소통 및 개인화된 콘텐츠 소비의 새로운 모델을 경험할 수 있다. 본 연구 결과는 차세대 음악 서비스 플랫폼의 가능성을 제시하고, 향후 관련 기술 및 응용 분야의 발전에 기여할 것으로 기대된다. -
Jun-Suk Koh;Yong-Bin Bae;Buyan-arvijikh;U-Yong Song;Jun-Yeop An;Youngjong Kim 817
대학교 학생들이 팀 프로젝트를 보다 효율적으로 수행할 수 있도록 돕는 Firebase 기반 웹 공유 캘린더 시스템을 제안한다. 이 시스템은 그룹 단위의 일정 공유, 학교 공식 일정과 개인 일정의 통합 뷰, 일정 별 코멘트 기능 등을 제공함으로써 협업의 편의성을 극대화한다. 본 프로젝트는 HTML, CSS, JavaScript 기반으로 구현되었으며, UI 는 Figma 를 통해 설계한 뒤 CSS 로 적용하였다. 백엔드는 Firebase 를 활용하여 인증, 데이터베이스, 호스팅 기능을 구성하였다. 이를 통해 사용자는 학교 이메일로 인증 받은 후, 원하는 그룹에 속하여 실시간으로 일정을 공유하고 확인할 수 있다. -
Jaewoo Kim;Jiyoung Bae;Mirae Yim;Jiwoo Hong;Youngjong Kim 819
현대인의 운동 부족 문제 해결을 위해 본 연구에서는 인증 사진, 운동 시간 및 운동 부위 정보를 활용하여 운동 수행 여부를 간편하게 인증할 수 있는 웹 기반 서비스를 제안한다. 제안된 서비스는 별도의 설치 없이 브라우저에서 동작하며, 사용자 통계 제공, 그룹 기능, 랭킹 시스템 등을 통해 참여 유도 및 동기 부여 효과를 기대할 수 있다. -
본 논문에서는 멀티로봇 시스템의 신뢰 기반 통신과 인증 문제를 해결하기 위해, 신뢰할 수 없는 멀티로봇 그룹이 협업을 수행하는 시나리오를 가정하고, 각 로봇의 신원 인증 및 작업 이력을 블록체인에 안전하게 저장하는 ROS 2 환경의 블록체인 기반 로봇 인증 시스템을 제안한다. 그룹 내 및 그룹 간 인증을 통해 각 로봇은 신뢰성 있게 상호작용하며, 작업 이력은 변경 불가능한 방식으로 블록체인에 기록된다. 실험 결과 시스템의 신뢰성과 투명성이 입증되었으며, 향후 양자 내성 암호 기반 보안 통신 체계가 무인 자동화 공정에 적용될 수 있을 것으로 기대된다.
-
Woo-Yeol Lee;Hui-Jun Song;Han-Been Jang;Seung-Hyun Seo 824
본 논문에서는 기존 클린봇의 한계를 극복하고자, 시선추적 및 얼굴 분석 기반 감정 인식 기술을 활용한 개인 맞춤형 AI 클린봇을 제안하였다. 사용자의 불쾌 반응을 사전에 감지하고, 이를 바탕으로 맞춤형 필터링이 가능한 데이터셋을 구성하여 웹 상 혐오 표현을 효과적으로 차단하였다. 제안한 시스템은 OpenCV와 dlib 기반의 시선 추적, DeepFace 기반의 감정 분석, 맞춤형 NLP 모델 학습 및 웹 크롤링 기반 필터링 모듈로 구성되었다. 제안한 시스템은 개인의 민감성에 기반하여 정밀한 차단이 가능하며, 향후 크리에이터 중심 플랫폼에도 효과적으로 적용될 수 있다. -
최근 APT 와 같은 고도화된 사이버 공격의 증가로, 실전형 침투 테스트의 필요성이 강조되고 있다. 본 연구에서는 공격 시나리오의 자동화 및 탐지 회피성을 강화하여 침투 테스트의 실전성을 높이기 위해 주요 오픈소스 C2 프레임워크들의 특성과 한계를 분석하고, 각 프레임워크의 강점을 조합한 통합 아키텍처를 설계하여 제안한다.
-
최근 사이버보안위협으로 인한 피해사례가 늘어나고 있다. 여러 보안 위협들이 존재하는데, 그 중 최신 보안 위협으로 APT 공격이 이슈가 되고 있다. 이는 정찰, 침입, 거점 확보, 권한 상승, 지속 유지, 데이터 유출 등을 통해 침투 후 지속적으로 대상의 정보를 정밀하게 빼내는 공격 방식이다. 이에 대한 방안으로 Red-Team 과 Blue-Team 의 협력을 통한 Purple-Team 이 제안한다. Red-Team 으로서 고도화된 공격 시나리오를 제안한다면, Blue-Team 에서도 이에 맞는 방어전략을 개선할 것이며, 결론적으로 보다 더 나은 Purple-Team 을 이끌어낼 수 있을 것이다. 본 연구에서는 Red-Team 으로서 고도화된 공격 시나리오를 도출하는 것이 목표이다.
-
본 논문에서 고도화되고 은밀해지는 사이버 공격에 효과적으로 대응하고자 다양한 EDR 솔루션들을 검토하였다. 그 중 ELK Stack 과 Wazuh 를 통합하여 사이버 공격에 탐지하고 대응하는 플랫폼을 제시하였다. 이를 위하여 각각의 특징과 장단점을 분석해보았으며, 연구 결과, 강력한 보안 모니터링 체계 및 자동화 대응이 가능한 플랫폼을 구축할 수 있음을 확인하였다.
-
본 연구는 최근 증가하는 고도화된 사이버 위협에 대응하기 위하여 MITRE ATT&CK 프레임워크를 기반으로 Red Team 공격 시나리오의 자동화 방법을 제시한다. 이를 위해 공격 자동화 플랫폼인 Caldera 와 오픈 소스 프레임워크 Metasploit, Sliver 를 활용하여 공격 시나리오를 설계하고 구현하였다.
-
본 연구에서는 소통의 본질을 이루기 위해, 다양한 메신저 플랫폼들을 하나로 통합하고 수신한 메시지들의 알림 여부를 딥러닝과 콘텐츠 기반 추천 시스템을 이용하여 판단한 후 결과에 따라 요약하여 제공하는 "메신저 통합 관리 플랫폼"을 제안한다. 이 과정에서 RAG, Content-based Recommendation System 과 같은 기술들의 이용이 사용자가 앞으로 중요하다고 여길 만한 메시지를 판별하는 과정에서 유의미한 결과를 가져오도록 설계했는지, 따라서 향후 사용자 친화적 중요 메시지 분류에 중요한 역할을 어떤 식으로 할 것인지 설득하는 과정을 소개한다.
-
본 연구는 리눅스 환경에서 오픈소스 기반의 행위 기반 로그 수집을 중심으로 보안 탐지 체계의 설계 방법론을 제시한다. Wazuh 와 ELK 스택을 연계하여 다계층 탐지 구조를 구성하고, Sigma 기반의 표준화된 룰 설계 및 적용 방안을 구체화한다.
-
Sang-Hyun Lee;Dong-Hwan Kim;Yong-Jin Jo;Hyunsuk Ko 838
본 연구에서는 반도체 테스트 공정 시에 발생하는 데이터인 WBM(Wafer Bin Map)이 불균형하고 다중 크기를 가진다는 특성을 고려하여, 세 가지 이미지 전처리 기법-(1) 리사이즈(Resize), (2) 3-채널 원-핫 인코딩(Pixel-wise One-Hot Encoding), (3) 오토인코더 기반 데이터 증강(Auto-encoder Based augmentation)-을 CNN(Convolution Neural Network) 학습 전에 적용하였다. 이후 배치 정규화(Batch Normalization)와 드롭아웃(Dropout)을 포함한 경량 CNN 을 설계하였다. 이는 전처리 된 이미지의 학습에 적용되어 효과적으로 과적합을 억제하고 94.45%의 테스트 정확도를 달성하였다. -
Bo Seong Jung;Ji-Hoon kim;Hyun-Jin Choi;Hyunsuk Ko 840
최근 가구 증가로 개인맞춤형 식생활 지원 서비스에 대한 수요가 높아지고 있다. 본 연구에서는 1 인 가구의 건강한 식생활을 지원하기 위해 대규모 언어 모델(LLM) 기반의 대화형 음식 추천 서비스를 개발하였다. 제안된 시스템은 사용자 취향 분석, 식재료 인식, 개인화된 레시피 추천, 대화형 요리 지원을 제공한다. YOLO 기반 식재료 인식, 식품의약품안전처 레시피 데이터 활용, RAG 기술 및 LangChain 프레임워크를 적용하여 사용자의 현재 상황을 반영한 실시간 맞춤형 추천을 구현하였다. 본 연구는 식재료 낭비 감소, 경제적 식생활 지원, 요리 진입 장벽 완화에 기여할 것으로 기대된다. -
최근 대규모 언어 모델(LLM)이 상용화됨에 따라, 자원이 제한된 컴퓨팅 환경에서도 효율적으로 동작할 수 있는 경량 LLM에 대한 수요가 증가하고 있다. 본 논문은 경량화된 1.58비트 모델인 BitNet과 Model Context Protocol(MCP)을 결합한 하이브리드 시스템을 제안한다. 시스템은 질의 복잡도에 따라 동적으로 처리 경로를 결정하는 방식으로 동작한다. 단순한 질의는 메모리 효율적인 BitNet이 직접 처리하여 에너지 소비와 지연 시간을 최소화하고, 실시간 데이터 검색이나 외부 도구 사용이 필요한 복잡한 질의는 BitNet이 MCP 호스트로서 적절한 MCP 서버와 통신한다. 모든 결과는 BitNet 내부에서 통합되어 처리된 후 일관된 응답을 생성한다. 이러한 접근 방식은 엣지 컴퓨팅, IoT 기기, 모바일 애플리케이션과 같이 제한된 컴퓨팅 환경에서 AI 활용성을 높이는데 기여할 수 있을 것으로 기대된다.
-
최근 개인정보 침해 사례가 증가함에 따라 개인정보 보호의 중요성이 부각되고 있다. 특히 음성이나 영상과 같은 비정형 데이터 내에 포함된 개인정보를 자동으로 식별하고 가명처리하는 기술이 주목받고 있다. 본 논문에서는 YouTube에 업로드된 영상으로부터 음성 데이터를 추출하고, 자동으로 가명처리한 후 다시 음성으로 변환하는 웹 기반 시스템을 제안한다. 사용자가 YouTube URL을 입력하면 youtube-dl을 통해 영상을 다운로드하고, OpenAI Whisper를 이용해 음성 데이터를 텍스트로 변환한다. 변환된 텍스트는 ETRI OpenAPI를 이용해 개인정보를 식별하고 가명처리한 뒤, gTTS(Google Text-to-Speech)를 이용해 음성 파일로 재구성된다. 본 연구는 이러한 오픈소스 도구들을 통합하여 음성 기반 콘텐츠의 비식별화를 자동화하고 개인정보 보호를 지원하는 실용적인 서비스를 구현하는 것을 목표로 한다.