• 제목/요약/키워드: FAQ

검색결과 73건 처리시간 0.029초

한국어 문형을 이용한 문장 정규화 기반의 FAQ 자동 응답 시스템 (An Automated FAQ Answering System Based on Sentence Normalization Using Korean Sentence Patterns)

  • 배경만;백종탁;고영중;김종훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.172-176
    • /
    • 2008
  • 인터넷 쇼핑몰과 같은 웹사이트에서 FAQ 검색의 중요성은 갈수록 증가되고 있다. 일반적으로 FAQ 검색을 하기 위해서 사용자가 직접 FAQ 리스트에서 FAQ를 찾거나 키워드 검색을 통해 FAQ를 찾는다. 하지만 이 방법은 FAQ 리스트를 찾는데 시간이 오래 걸리고 사용자가 만족하는 결과를 보여주지 못하는 경우가 많다. 이를 해결하기 위해 사용자의 자연어 질의에 대해 자동으로 FAQ를 찾아주는 FAQ 시스템이 필요하다. 자동화된 FAQ 시스템은 사용자의 질의 문장에 대해 FAQ 목록 중에 가장 유사한 FAQ 문장을 찾아준다. 이를 위해 각 문장을 유니그램과 바이그램 단어 집합으로 표현하여 문장 간의 유사도를 계산한다. 본 논문에서는 유니그램과 바이그램 단어 집합뿐만이 아니라 한국어 문형을 기반으로 한 문장 정규화를 통해 단어의 문장 성분 정보와 성분 내 위치 정보를 이용하여 문장을 표현함으로써 자동화된 FAQ 시스템의 성능을 향상 시키는 것을 목표로 한다.

  • PDF

대학도서관 웹사이트의 FAQ 내용분석을 통한 이용자 안내에 관한 연구 (A Study on the User Guide through Content Analysis of the FAQ at Academic Library Web Site)

  • 최흥식
    • 정보관리학회지
    • /
    • 제20권2호
    • /
    • pp.219-239
    • /
    • 2003
  • 본 연구의 목적은 이용자에게 효율적인 도서관 및 정보이용안내를 제공하는데 있다 본 연구의 목적달성을 위하여, 도서관 FAQ의 구조적 특성과 질의내용을 분석하여 효과적인 FAQ의 접근단계와 환경변화에 따른 안내항목을 제안하였다. 또한 도서관이용법과 관련된 도서내용과 FAQ질의 내용을 비교 분석하여 새로이 추가되거나 강화되어야 할 내용을 제안하였다. 본 연구의 결과는 도서관 이용에 관한 FAQ의 작성과 관련하여 포함되어야 할 사항의 결정은 물론 도서관 정보이용 교재개발 등의 기초 자료로 활용될 수 있을 것으로 기대된다.

신뢰성이 부족한 FAQ 데이터셋에서의 강건성 개선을 위한 모델의 예측 강도 기반 손실 조정 정규화 (Loss-adjusted Regularization based on Prediction for Improving Robustness in Less Reliable FAQ Datasets)

  • 박예원;양동일;김수필;이강욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.18-22
    • /
    • 2019
  • FAQ 분류는 자주 묻는 질문을 범주화하고 사용자 질의에 대해 가장 유사한 클래스를 추론하는 방식으로 진행된다. FAQ 데이터셋은 클래스가 다수 존재하기 때문에 클래스 간 포함 및 연관 관계가 존재하고 특정 데이터가 서로 다른 클래스에 동시에 속할 수 있다는 특징이 있다. 그러나 최근 FAQ 분류는 다중 클래스 분류 방법론을 적용하는 데 그쳤고 FAQ 데이터셋의 특징을 모델에 반영하는 연구는 미미했다. 현 분류 방법론은 이러한 FAQ 데이터셋의 특징을 고려하지 못하기 때문에 정답으로 해석될 수 있는 예측도 오답으로 여기는 경우가 발생한다. 본 논문에서는 신뢰성이 부족한 FAQ 데이터셋에서도 분류를 잘 하기 위해 손실 함수를 조정하는 정규화 기법을 소개한다. 이 정규화 기법은 클래스 간 포함 및 연관 관계를 반영할 수 있도록 오답을 예측한 경우에도 예측 강도에 비례하여 손실을 줄인다. 이는 오답을 높은 확률로 예측할수록 데이터의 신뢰성이 낮을 가능성이 크다고 판단하여 학습을 강하게 하지 않게 하기 위함이다. 실험을 위해서는 다중 클래스 분류에서 가장 좋은 성능을 보이고 있는 모형인 BERT를 이용했으며, 비교 실험을 위한 정규화 방법으로는 통상적으로 사용되는 라벨 스무딩을 채택했다. 실험 결과, 본 연구에서 제안한 방법은 기존 방법보다 성능이 개선되고 보다 안정적으로 학습이 된다는 것을 확인했으며, 데이터의 신뢰성이 부족한 상황에서 효과적으로 분류를 수행함을 알 수 있었다.

  • PDF

FAQ 분류 성능 향상을 위한 클래스 일치 여부 결합 학습 모델 (Jointly learning class coincidence classification for FAQ classification)

  • 양동일;함진아;이강욱;이지연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.12-17
    • /
    • 2019
  • FAQ(Frequently Asked Questions) 질의 응답 시스템은 자주 묻는 질문과 답변을 정의하고, 사용자 질의에 대해 정의된 답변 중 가장 알맞는 답변을 추론하여 제공하는 시스템이다. 정의된 대표 질문 및 대응하는 답변을 클래스(Class)라고 했을 때, FAQ 질의 응답 시스템은 분류(Classification) 문제라고 할 수 있다. 종래의 FAQ 분류는 동일 클래스 내 동의 문장(Paraphrase)에서 나타나는 공통적인 특징을 통해 분류 문제를 학습하였으나, 이는 비슷한 단어 구성을 가지면서 한 두 개의 단어에 의해 의미가 다른 문장의 차이를 구분하지 못하며, 특히 서로 다른 클래스에 속한 학습 데이터 간에 비슷한 의미를 가지는 문장이 존재할 때 클래스 분류에 오류가 발생하기 쉬운 문제점을 가지고 있다. 본 논문에서는 이 문제점을 해결하고자 서로 다른 클래스 내의 학습 데이터 문장들이 상이한 클래스임을 구분할 수 있도록 클래스 일치 여부(Class coincidence classification) 문제를 결합 학습(Jointly learning)하는 기법을 제안한다. 동일 클래스 내 학습 문장의 무작위 쌍(Pair)을 생성 및 학습하여 해당 쌍이 같은 클래스에 속한다는 것을 학습하게 하면서, 동시에 서로 다른 클래스 간 학습 문장의 무작위 쌍을 생성 및 학습하여 해당 쌍은 상이한 클래스임을 구분해 내는 능력을 함께 학습하도록 유도하였다. 실험을 위해서는 최근 발표되어 자연어 처리 분야에서 가장 좋은 성능을 보이고 있는 BERT 의 텍스트 분류 모델을 이용했으며, 제안한 기법을 적용한 모델과의 성능 비교를 위해 한국어 FAQ 데이터를 기반으로 실험을 진행했다. 실험 결과, 분류 문제만 단독으로 학습한 BERT 기본 모델보다 본 연구에서 제안한 클래스 일치 여부 결합 학습 모델이 유사한 문장들 간의 차이를 구분하며 유의미한 성능 향상을 보인다는 것을 확인할 수 있었다.

  • PDF

텍스트마이닝을 활용한 웹사이트 FAQ 개선방안: S대학교 사례를 중심으로 (Improvement Plan of Web Site FAQ using Text Mining : Focused on the S University Case)

  • 안수현;조정현;이상준
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.361-362
    • /
    • 2018
  • 본 연구는 대학 웹페이지의 Q&A(질의응답) 게시판에 게재된 비정형화 된 데이터를 수집한 후 텍스트마이닝과 네트워크 분석을 활용하여 자주 등장하는 키워드 간 연관 패턴을 파악하고자 한다. 분석결과를 바탕으로 FAQ(자주하는 질문) 게시판을 구성한다면 반복적인 질문에 대한 민원을 간소화함으로써 수요자의 편의성과 행정의 효율성 향상에 기여하고 나아가 원활한 양방향 소통이 가능할 것으로 기대한다.

  • PDF

의미 연결망 분석을 활용한 대학 홈페이지 FAQ 개선방안 (Improving University Homepage FAQ Using Semantic Network Analysis)

  • 안수현;이상준
    • 디지털융복합연구
    • /
    • 제16권9호
    • /
    • pp.11-20
    • /
    • 2018
  • 민원 질의응답의 소통수단으로 보편화된 Q&A 게시판에는 반복된 질문들이 자주 등록되어 민원업무를 효율적으로 관리할 필요성이 제기된다. 본 연구는 대학 홈페이지의 Q&A 게시판에 게재된 비정형 데이터를 중심으로 학생 중심의 질의응답집(FAQ)을 구성하고자 한다. 이에 최근 3년간 690건의 게시물에서 주요 핵심어를 추출하고 의미 연결망 분석을 통해 중심성 분석 및 핵심어 사이의 관계성을 파악하여 네트워크 시각화를 진행하였다. 분석결과 민원질의에서 가장 중심성이 높은 핵심어는 신청, 교과목, 학점, 이수, 졸업, 승인, 기간, 전공, 포털, 학과 등의 순이었다. 또한 주요 핵심어들은 수업, 학적, 학생활동, 장학금, 도서관, 생활관, 정보화, 통학 영역의 8개 군집으로 구분되었다. 이를 토대로 질의횟수가 많은 내용을 분야별로 정리하여 FAQ를 구성한다면 반복적인 질문에 대한 민원응대 프로세스를 간소화함으로써 수요자의 편의성과 행정의 효율성 향상에 기여하고 나아가 대학 구성원간의 원활한 양방향 소통이 가능할 것으로 기대한다.

Self-Attention 기반의 문장 임베딩을 이용한 효과적인 문장 유사도 기법 기반의 FAQ 시스템 (An Effective Sentence Similarity Measure Method Based FAQ System Using Self-Attentive Sentence Embedding)

  • 김보성;김주애;이정엄;김선아;고영중;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.361-363
    • /
    • 2018
  • FAQ 시스템은 주어진 질문과 가장 유사한 질의를 찾아 이에 대한 답을 제공하는 시스템이다. 질의 간의 유사도를 측정하기 위해 문장을 벡터로 표현하며 일반적으로 TFIDF, Okapi BM25와 같은 방법으로 계산한 단어 가중치 벡터를 이용하여 문장을 표현한다. 하지만 단어 가중치 벡터는 어휘적 정보를 표현하는데 유용한 반면 단어의 의미적인(semantic) 정보는 표현하기 어렵다. 본 논문에서는 이를 보완하고자 딥러닝을 이용한 문장 임베딩을 구축하고 단어 가중치 벡터와 문장 임베딩을 조합한 문장 유사도 계산 모델을 제안한다. 또한 문장 임베딩 구현 시 self-attention 기법을 적용하여 문장 내 중요한 부분에 가중치를 주었다. 실험 결과 제안하는 유사도 계산 모델은 비교 모델에 비해 모두 높은 성능을 보였고 self-attention을 적용한 실험에서는 추가적인 성능 향상이 있었다.

  • PDF

Antioxidant Activity of Extracts from Akebia quinata Decne

  • Rim, A-Ram;Kim, Sun-Jung;Jeon, Kyung-Im;Park, Eun-Ju;Park, Hae-Ryong;Lee, Seung-Cheol
    • Preventive Nutrition and Food Science
    • /
    • 제11권1호
    • /
    • pp.84-87
    • /
    • 2006
  • Antioxidant activity of Akebia quinata Decne was evaluated. Water extract (0.5 g/50 mL) of flowers and leaves of A. quinata were prepared and total phenol contents and radical scavenging activity of the extracts was determined for antioxidant activity. The total phenol contents of extracts from A. quinata flowers (FAQ) and leaves (LAQ) were $30.05{\mu}M\;and\;20.23{\mu}M$, while the radical scavenging activity of FAQ and LAQ were 60.51 % and 52.97%, respectively. In addition, the effect of FAQ and LAQ extract on DNA damage induced by $H_2O_2$ in human lymphocytes was evaluated by comet assay. The FAQ and LAQ showed strong inhibitory effect against DNA damage induced by $200{\mu}M$ of $H_2O_2$. These results suggest that water extracts of A. quinata Decne flowers and leaves showed significant (p<0.05) antioxidant activity and protective effect against oxidative DNA damage.

전자게시판을 이용한 대학도서관의 참고정보저비스에 관한 연구 -자유게시판, Q&A, FAQ, 참고질의응답을 중심으로- (A Study on the Electronic Reference Services Using Electronic Bulletin Boards in University Libraries)

  • 이명희;이미영
    • 한국비블리아학회지
    • /
    • 제14권2호
    • /
    • pp.159-178
    • /
    • 2003
  • 본 연구는 대학도서관에서 제공하는 전자게시판 중 자유게시판, Q&A, FAQ, 참고질의 응답의 4가지 유형의 참고서비스를 대상으로 게재되는 질문의 유형과 내용을 분석함으로써 서비스 유형별 특성을 조사하고 이용자의 정보요구를 파악하였다. 분석한 결과, 4가지 서비스의 유형에 따라 질문유형별 차이를 발견하지 못하였다. 모든 서비스에서 안내형 질문이 가장 많았으며, 주제형 질문은 미미한 것으로 나타났다. 분석결과를 토대로 4가지 유형별 서비스에 대한 발전방안을 제시하였다: 서비스 유형에 대한 메뉴명칭의 표준화, 서비스 접근이 용이한 메뉴 배치, 각 서비스에 적합한 성격 명시, 내용검색기능과 응답기능을 첨가하는 구조개선, 질문작성 양식의 제안, 전자참고서비스의 전담부서 및 전담자배치, 정책마련, 홍보강화를 제안하였다.

  • PDF