• 제목/요약/키워드: Cross Encoder

검색결과 24건 처리시간 0.019초

문장 임베딩을 위한 Cross-Encoder의 Re-Ranker를 적용한 의미 검색 기반 대조적 학습 (Contrastive Learning of Sentence Embeddings utilizing Semantic Search through Re-Ranker of Cross-Encoder)

  • 오동석;김수완;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.473-476
    • /
    • 2022
  • 문장 임베딩은 문장의 의미를 고려하여 모델이 적절하게 의미적인 벡터 공간에 표상하는 것이다. 문장 임베딩을 위해 다양한 방법들이 제안되었지만, 최근 가장 높은 성능을 보이는 방법은 대조적 학습 방법이다. 대조적 학습을 이용한 문장 임베딩은 문장의 의미가 의미적으로 유사하면 가까운 공간에 배치하고, 그렇지 않으면 멀게 배치하도록 학습하는 방법이다. 이러한 대조적 학습은 비지도와 지도 학습 방법이 존재하는데, 본 논문에서는 효과적인 비지도 학습방법을 제안한다. 기존의 비지도 학습 방법은 문장 표현을 학습하는 언어모델이 자체적인 정보를 활용하여 문장의 의미를 구별한다. 그러나, 하나의 모델이 판단하는 정보로만 문장 표현을 학습하는 것은 편향적으로 학습될 수 있기 때문에 한계가 존재한다. 따라서 본 논문에서는 Cross-Encoder의 Re-Ranker를 통한 의미 검색으로부터 추천된 문장 쌍을 학습하여 기존 모델의 성능을 개선한다. 결과적으로, STS 테스크에서 베이스라인보다 2% 정도 더 높은 성능을 보여준다.

  • PDF

Poly-encoder기반의 COVID-19 질의 응답 태스크 (Poly-encoder based COVID-19 Question and Answering with Task Adaptation)

  • 이설화;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.188-191
    • /
    • 2020
  • 본 연구는 COVID-19 질의 응답 태스크를 위한 Poly-encoder 기반의 태스크를 제안하였다. COVID-19 질의 응답 시스템은 사람들에게 최신 정보에 대해 빠르고 신뢰성이 높은 정보를 전달하는 특성을 가져야한다. 검색 기반 질의 응답 시스템은 pairwise 연산을 기반으로 수행되는데, Poly-encoder는 사전 학습된 트랜스포머(transformer)기반의 pairwise 연산 방법론 중 기존 Cross-encoder와 Bi-encoder보다 실사용 및 성능이 뛰어남을 보였다 [1]. 특히, Poly-encoder는 정확도가 높으면서도 빠른 응답속도를 가지며 검색기반의 각종 태스크에서 좋은 성능을 보였다. 따라서 본 연구는 COVID-19를 위한 Poly-encoder기반의 질의 응답 태스크를 위하여 기존 질의 응답 태스크와 페르소나 기반의 질의 응답 태스크로 두 가지 유형의 태스크를 생성하여 모델을 학습하였다. 또한 신뢰성 있는 리소스정보로부터 모델에 최신 정보 반영을 위하여 자동 크롤러를 구축하여 데이터를 수집하였다. 마지막으로 전문가를 통한 데이터셋을 구축하여 질문-응답과 질의어-질문에 대한 모델 검증을 수행하였다.

  • PDF

여기신호의 상관관계 기반 joint coding을 이용한 MPEG-4 audio lossless coding 인코더 복잡도 감소 방법 (A Complexity Reduction Method of MPEG-4 Audio Lossless Coding Encoder by Using the Joint Coding Based on Cross Correlation of Residual)

  • 조충상;김제우;최병호
    • 대한전자공학회논문지SP
    • /
    • 제47권3호
    • /
    • pp.87-95
    • /
    • 2010
  • 오디오 신호를 무손실 압축하여 휴대용 멀티미디어 기기에서 최고의 오디오 품질을 제공하는 기기들이 등장하고 있으며, 무손실 오디오 압축을 위한 기술에서는 2006년 MPEG-4 audio lessless coding(ALS)와 MPEG-4 scalable lossless coding(SLS)가 국제 표준으로 채택 되었다. 2009년에는 MPEG에서 최대 스테레오 음원까지만 지원하는 MPEG-4 ALS simple profile을 정의하였다. 표준화된 무손실 오디오 코덱이 휴대용 멀티미디어 기기에서 널리 이용되기 위해서는 휴대용 멀티미디어 기기에서 가장 널리 쓰이는 스테레오 조건에서 낮은 복잡도를 보여야 한다. 하지만 기존 연구에서는 MPEG-4 ALS의 압축률을 향상시키거나, 혹은 다채널 환경에서의 복잡도를 개선하기 위한 연구들이 주로 이루어졌다. 본 논문에서는 MPEG-4 ALS 인코더의 복잡도와 압축률을 분석하고, 이를 바탕으로 MPEG-4 ALS simple profile 조건에서 MPEG-4 ALS 인코더의 복잡도를 개선하기 위한 방법을 제안한다. 분석 결과 MPEG-4 ALS 인코더의 analysis 블록에서 전체 복잡도의 75% 발생하므로, 기존의 연구에서 개발된 저 복잡도 필터를 인코더에 적용하여 복잡도를 감소시키며, joint coding의 압축 효율과 여기 신호의 상호상관계수의 관계를 기반으로 joint coding 결정 방법을 제안한다. 제안된 방법과 저 복잡도 필터가 포함된 MPEG-4 ALS 인코더의 성능은 MPEG-4 conformance test 파일과 일반 음악 파일을 이용하여 복잡도 및 압축률로써 평가된다. 실험 결과 제안된 방법이 적용되었을 경우 압축률은 유사하면서 인코더 복잡도가 24% 감소한다. 이를 통해 본 논문에서 제안된 방법이 MPEG-4 ALS 인코더의 복잡도 감소에 탁월한 성능을 가짐을 보였다.

Time-Series Forecasting Based on Multi-Layer Attention Architecture

  • Na Wang;Xianglian Zhao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권1호
    • /
    • pp.1-14
    • /
    • 2024
  • Time-series forecasting is extensively used in the actual world. Recent research has shown that Transformers with a self-attention mechanism at their core exhibit better performance when dealing with such problems. However, most of the existing Transformer models used for time series prediction use the traditional encoder-decoder architecture, which is complex and leads to low model processing efficiency, thus limiting the ability to mine deep time dependencies by increasing model depth. Secondly, the secondary computational complexity of the self-attention mechanism also increases computational overhead and reduces processing efficiency. To address these issues, the paper designs an efficient multi-layer attention-based time-series forecasting model. This model has the following characteristics: (i) It abandons the traditional encoder-decoder based Transformer architecture and constructs a time series prediction model based on multi-layer attention mechanism, improving the model's ability to mine deep time dependencies. (ii) A cross attention module based on cross attention mechanism was designed to enhance information exchange between historical and predictive sequences. (iii) Applying a recently proposed sparse attention mechanism to our model reduces computational overhead and improves processing efficiency. Experiments on multiple datasets have shown that our model can significantly increase the performance of current advanced Transformer methods in time series forecasting, including LogTrans, Reformer, and Informer.

다중 사용자 환경에서의 광 CDMA 시스템 성능 분석 (Performance Analysis of an Optical CDMA System for multi-user Environment)

  • 전상영;김영일;이주희
    • 한국통신학회논문지
    • /
    • 제24권6B호
    • /
    • pp.1134-1141
    • /
    • 1999
  • 본 논문에서는 광 코드분할 다중접속(optical code division multiple access)시스템을 구현하고 그 구현된 시스템의 성능을 분석한다. 구현된 OCDMA 시스템에서 송신단은 레이저 다이오드를 이용하여 데이터를 광 펄스로 변환하며, 4단의 지연단으로 구성한 인코더를 이용하여 펄스 열로 확산한다. 수신단에서는 인코더의 지연선 구조와 동일한 구조의 디코더에서 펄스를 지연시킨 후 결합하여 수신된 신호를 복원한다. 성능분석에 있어서는, 먼저 단일 사용자 및 다중 사용자 환경 하에서 광 CDMA 신호의 auto-correlation과 cross-correlation을 분석하고, 실험을 통해 시뮬레이션 결과를 검증하였다. 또한 광섬유 지연선의 단 수 및 코드 길이 등 시스템의 성능에 영향을 미치는 파라메타를 컴퓨터 시뮬레이션을 통해 분석하였다. 실험 결과는 인코더와 디코더의 지연선 구조가 동일한 경우 펄스 열의 중앙에서 피크값의 펄스가 발생하는 auto-correlation 특성에 의해 데이터를 복원할 수 있었고, 지연선 구조가 동일하지 않은 경우 cross-correlation 특성에 의해 데이터를 복원할 수 없었다. 성능 분석 결과는 코드 길이가 감소하거나, 지연단위의 단 수를 증 $]$쳔갭\ulcorner비트 에러 확률이 감소하지만 요구되는 레이저 광원의 펄스폭이 점차로 감소하므로 시스템 구현이 어렵게 된다. 이러한 실험 및 분석 결과를 이용하면 CDMA 기술을 광 통신 네트워크로 적용할 수 있다.

  • PDF

ARM Core(R)를 이용한 AMR-WB+ 오디오 부호화기의 실시간 구현 (Real-time Implementation of the AMR-WB+ Audio Coder using ARM Core(R))

  • 원양희;이형일;강상원
    • 대한전자공학회논문지SP
    • /
    • 제46권3호
    • /
    • pp.119-124
    • /
    • 2009
  • 본 논문에서는 AMR Core(R)를 이용해서 AMR-WB+ 오디오 부호화기를 실시간 구현하였다. 구현 시 사용된 최적화 방법은 어셈블리어 단계에서 수행되었고, latency를 제거하고 32비트 레지스터를 사용하였다. 구현된 음성 부호화기는 평균 복잡도가 ARM9E 버전에서 인코더 160.76MHz, 디코더 33.05MHz으로 총 193.81MHz로 측정되었다. 사용된 ROM의 크기는 인코더 65.21Kbyte, 디코더 32.01Kbyte, 공통소스 279.81Kbyte이다. 구현된 AMR-WB+ 소스 코드는 3GPP에서 제공하는 테스트 벡터들을 CodeWarrior와 목표 PDA 상에서 모두 bit-exact하게 통과함을 보임으로써 검증되었다.

FO-CDMA 통신망에서 PCAE와 PCAD 동작특성 분석 (Performance Analysis of the PCAE and PCAD in FO-CDMA Communication Network)

  • 강태구;최영완
    • 정보통신설비학회논문지
    • /
    • 제2권4호
    • /
    • pp.5-16
    • /
    • 2003
  • Parallel Coupler Access Encoder(PCAE)와 Parallel Coupler Access Decoder(PCAD)를 이용한 FO-CDMA(Fiber-Optic Code Division Multiple Access)시스템에서 광정합필터 특성을 실험을 통해 분석하였다. PCAE와 PCAD를 구성하고 있는 즉, 1xN splitter와 Nx1 combiner사이에 접속된 광지연선로의 길이비율을 광직교코드 생성알고리즘에 의해 결정하였고, 부/복호화 과정 및 시그템 성능을 peak to side-lobe ratio(PSR)를 구하여 기존에 제시된 결과와 비교하였다. 기존의 연구에서는 SCAE 및 SCAD를 이용하여 일차신호만을 고려하여 시스템의 성능을 분석하여 성능평가가 정확하지가 않았다. SCAE 및 SCAD는 커플러수를 증가함에 따라 여러 형태의 간섭신호들을 가지므로, 이러한 신호들이 시스템 성능을 현저히 열화 시킨다. 본 논문에서는 $\alpha$(coupling coefficient)값이 커질수록 PCAE와 PCAD를 이용한 PSR이 향상됨을 밝혔고 FO-CDMA 통신망의 성능을 개선하기 위해서는 SCAE와 분석 SCAD 구조보다는 PCAE와 PCAD 구조가 적합함을 제시하였다.

  • PDF

H.264/AVC 움직임 추정을 위한 효율적인 정적 블록 스킵 방법과 결합된 다이아몬드 웹 격자 탐색 알고리즘 (A Diamond Web-grid Search Algorithm Combined with Efficient Stationary Block Skip Method for H.264/AVC Motion Estimation)

  • 정창욱;최진구;이케나가 다케시;고토 사토시
    • 인터넷정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.49-60
    • /
    • 2010
  • H.264/AVC 표준은 여러 가지 신기술들을 접목시킴으로써 기존의 동영상 표준들보다 한층 개선된 부호화 효율성을 제공한다.하지만, H.264/AVC 인코더의 향상된 부호화 기술은 그것의 전반적인 복잡도를 크게 증가시켰다. 따라서, 인코더의 복잡도 수준을 경감시키기 위한 최적화의 연구는 중대한 선결 과제이다. 특히, 움직임 추정 부분에 대한 계산량의 비율은 인코더의 작업시간을 크게 좌우한다. 본 논문에서는 완전 다이아몬드와 12각형을 기본 탐색 패턴으로 사용하고 특정한 임계기준치를 적용시킴으로써 효율적으로 정적 블록들을 스킵하는 다이아몬드 웹 격자 탐색 알고리즘을 제안한다. 실험 결과는 본 논문에서 제안된 기법이 기존의 UMHexagonS 알고리즘의 계산량을 12%까지 감소시키면서도 유사한 PSNR을 유지한다는 것을 보여준다.

이중 링 Add/Drop 필터와 All-pass 지연 필터로 구성된 이차원 OCDMA 인코더/디코더 (Two-dimensional OCDMA Encoder/Decoder Composed of Double Ring Add/Drop Filters and All-pass Delay Filters)

  • 정영철
    • 한국광학회지
    • /
    • 제33권3호
    • /
    • pp.106-112
    • /
    • 2022
  • 이중 링 add/drop 필터와 all-pass 지연 필터로 구성된 이차원 optical code division multiple access (OCDMA) 인코더/디코더를 제안하고, 설계 예시 및 수치해석을 통하여 실현 가능성을 확인하였다. 제안된 OCDMA 인코더/디코더의 칩 면적은 지연 도파로를 사용하는 기존 OCDMA 인코더/디코더에 비하여 1/3 정도로 줄어든다. 제안된 소자의 성능을 모델링하기 위하여 고속 푸리에 변환(fast Fourier transform, FFT) 및 전달 행렬 기법을 사용하였다. 정확한 코드로 디코딩된 펄스의 중심에서 자기상관 피크 값은 어긋난 파장 호핑 코드 및 스펙트럼 위상 코드로 디코딩된 경우의 최대 교차상관 레벨에 비하여 3배 이상으로 관측되었다. 이를 통하여 forward error correction (FEC) 한계에 해당하는 10-3 이하의 비트 에러 오율을 얻을 수 있음을 알 수 있다.

MANET에서 비디오 전송 품질을 위한 Cross-layer 시뮬레이션과 분석 (Cross-layer Simulation and Analysis for Video Transmission Quality in MANET)

  • 윤협상
    • 한국시뮬레이션학회논문지
    • /
    • 제24권3호
    • /
    • pp.61-68
    • /
    • 2015
  • MANET(Mobile ad hoc networks)은 이동 단말로 구성된 동적인 자가 생성 네트워크를 의미한다. 본 연구에서는 MANET에서 비디오 전송 서비스를 다루고 있는 최근 연구를 보완하기 위한 개선된 cross-layer 접근 방법을 제시하고 있다. 본 연구는 ns-3 시뮬레이션을 통해 수행되며, 시뮬레이션에 소요되는 시간을 감안하여 효율적으로 각 계층의 주요 인자의 상호작용을 동시에 고려하기 위해 통계적 실험계획법을 활용하고자 한다. 제안된 cross-layer 접근 방법은 MANET 프로토콜 계층(물리, 네트워크, 전송 계층)과 응용 계층(비디오 인코더)를 동시에 인자로 다루고 있고, 반응 변수로는 객관적 비디오 품질 지표를 포함한다. 본 연구의 결과는 통제 불가능한 인자의 값에 따라 통제 가능한 인자를 설정하여 최적의 비디오 품질을 제공하는 MANET 비디오 전송 어플리케이션을 설계하는 기초 연구로써 활용될 수 있다.