• 제목/요약/키워드: Text-to-SQL

검색결과 24건 처리시간 0.031초

대형 언어 모델의 한국어 Text-to-SQL 변환 능력 평가 (Evaluation of Large Language Models' Korean-Text to SQL Capability)

  • 최주영;민경구;심묘섭;정해민;박민준;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.171-176
    • /
    • 2023
  • 최근 등장한 대규모 데이터로 사전학습된 자연어 생성 모델들은 대화 능력 및 코드 생성 태스크등에서 인상적인 성능을 보여주고 있어, 본 논문에서는 대형 언어 모델 (LLM)의 한국어 질문을 SQL 쿼리 (Text-to-SQL) 변환하는 성능을 평가하고자 한다. 먼저, 영어 Text-to-SQL 벤치마크 데이터셋을 활용하여 영어 질의문을 한국어 질의문으로 번역하여 한국어 Text-to-SQL 데이터셋으로 만들었다. 대형 생성형 모델 (GPT-3 davinci, GPT-3 turbo) 의 few-shot 세팅에서 성능 평가를 진행하며, fine-tuning 없이도 대형 언어 모델들의 경쟁력있는 한국어 Text-to-SQL 변환 성능을 확인한다. 또한, 에러 분석을 수행하여 한국어 문장을 데이터베이스 쿼리문으로 변환하는 과정에서 발생하는 다양한 문제와 프롬프트 기법을 활용한 가능한 해결책을 제시한다.

  • PDF

Web을 이용한 SQL 데이터베이스 통합 기술 (Integration of SQL based Databases into World Wide Web)

  • 김미희;임연호;박찬범
    • 전자통신동향분석
    • /
    • 제11권1호통권39호
    • /
    • pp.1-8
    • /
    • 1996
  • 웹 서비스가 인터넷을 주도하면서 Hyper Text Markup Language(HTML) 문서 위주의 정보검색 서비스에서 한 발 더 나아가 SQL 데이터베이스와 웹을 통합하여 이를 비즈니스 분야로 확대 발전시키기 위한 연구가 진행되고 있다. 실제로 많은 웹 서버에서 Common Gateway Interface(CGI) 기능을 데이터베이스 검색에 활용하고 있다. 이와 함께 GCI를 사용자 입장에서 한 단계 발전시킨 WWW interface to DataBase(WDB), Gateway Structure Query Language(GSQL) 등이 인터넷에서 소개되고 있다. 본 고에서는 현재 다각도로 진행중인 웹과 데이터베이스 통합기술 동향을 CGI와 WDB를 통해 살펴보았다.

Spatial XQuery2SQL Converter를 위한 알고리즘 (The Algorithm For Spatial XQuery2SQL Converter)

  • 최영운;서현호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.442-447
    • /
    • 2004
  • XML은 1996년 W3C(World Wide Web Consortium)에서 제안한 것으로서 웹상에서 구조화된 문서를 전송 가능하도록 설계된 표준화된 텍스트 형식이다. 이는 인터넷에서 기존에 사용하던 HTML의 한계를 극복하고 SGML의 복잡함을 해결하는 방안으로써 HTML에 사용자가 새로운 태그를 정의할 수 있는 기능이 추가되었다. 이러한 XML문서를 RDBMS에서 저장해서 사용하기 위한 많은 노력이 있으나 구조적으로 XML문서는 트리구조이어서 관계형 DB에 자료를 질의하기 위한 언어인 SQL과 완벽한 호환을 이루지 못한다 그래서 W3C의 XML 표준 질의인 XQuery가 등장하게 되었다. 이 논문에서는 공간 정보를 포함한 XML 정보들을 RDBMS에 저 장후 공간연산자, 공간함수를 통한 Sqatial XQuery2SQL이라는 변환기를 통해서 Spatial XQuery를 SQL로 변환한 후 RDBMS에 있는 정보를 추출하는 Sqatial XQuery2SQL 변환 알고리즘을 구현하고자 한다.

  • PDF

XSTAR: XML 질의의 SQL 변환 알고리즘 (XSTAR: XQuery to SQL Translation Algorithms on RDBMS)

  • 홍동권;정민경
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.430-433
    • /
    • 2007
  • XML이 다양한 분야에 널지 이용되면서 대용량의 XML을 효과적으로 관리하는 여러 가지 방법들이 연구되고 있다. 특히 지금가지 상업적, 기술적으로 성공적인 데이터 모델인 관계형 데이터베이스를 기반으로 한 여러 가지 방법들이 연구되고 있다. 본 논문은 관계형 DBMS를 사용하여 XML 질의어인 XQuery를 SQL로 변환하는 알고리즘인 XSTAR(XQuery to SQL Translation Algorithms on RDBMS)를 설계 및 구현한다. 본 연구의 XSTAR 알고리즘은 기본적인 XPath 뿐만 아니라 XQuery FLWOR 표현식, XQuery함수, 그리고 전문 검색(Fulltext 검색[8])과 관련된 몇몇 특수한 기능을 효율적으로 지원할 수 있으며, 질의의 결과 값을 XML 형태로 재생성하여 사용자에게 반환한다. 본 논문에서 제안하는 XSTAR 알고리즘은 현재 웹 상에서 공개적으로 시범 운용되고 있는 XML 문서의 관리 및 질의 처리 시스템인 XPERT(XML Query Processing Engine using Relational Technologies, http://dblab.kmu.ac.kr/project.jsp")의 질의 처리 엔진으로 사용되고 있다.

A Development of Forward Inference Engine and Expert Systems based on Relational Database and SQL

  • Kim, Jin-Sung
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.49-52
    • /
    • 2003
  • In this research, we propose a mechanism to develop an inference engine and expert systems based on relational database and SQL (structured query language). Generally, former researchers had tried to develop an expert systems based on text-oriented knowledge base and backward/forward (chaining) inference engine. In these researches, however, the speed of inference was remained as a tackling point in the development of agile expert systems. Especially, the forward inference needs more times than backward inference. In addition, the size of knowledge base, complicate knowledge expression method, expansibility of knowledge base, and hierarchies among rules are the critical limitations to develop an expert systems. To overcome the limitations in speed of inference and expansibility of knowledge base, we proposed a relational database-oriented knowledge base and forward inference engine. Therefore, our proposed mechanism could manipulate the huge size of knowledge base efficiently, and inference with the large scaled knowledge base in a short time. To this purpose, we designed and developed an SQL-based forward inference engine using relational database. In the implementation process, we also developed a prototype expert system and presented a real-world validation data set collected from medical diagnosis field.

  • PDF

RDB-based Automatic Knowledge Acquisition and Forward Inference Mechanism for Self-Evolving Expert Systems

  • Kim, Jin-Sung
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.743-748
    • /
    • 2003
  • In this research, we propose a mechanism to develop an inference engine and expert systems based on relational database (RDB) and SQL (structured query language). Generally, former researchers had tried to develop an expert systems based on text-oriented knowledge base and backward/forward (chaining) inference engine. In these researches, however, the speed of inference was remained as a tackling point in the development of agile expert systems. Especially, the forward inference needs more times than backward inference. In addition, the size of knowledge base, complicate knowledge expression method, expansibility of knowledge base, and hierarchies among rules are the critical limitations to develop an expert system. To overcome the limitations in speed of inference and expansibility of knowledge base, we proposed a relational database-oriented knowledge base and forward inference engine. Therefore, our proposed mechanism could manipulate the huge size of knowledge base efficiently. and inference with the large scaled knowledge base in a short time. To this purpose, we designed and developed an SQL-based forward inference engine using relational database. In the implementation process, we also developed a prototype expert system and presented a real-world validation data set collected from medical diagnosis field.

On supporting full-text retrievals in XML query

  • Hong, Dong-Kweon
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제7권4호
    • /
    • pp.274-278
    • /
    • 2007
  • As XML becomes the standard of digital data exchange format we need to manage a lot of XML data effectively. Unlike tables in relational model XML documents are not structural. That makes it difficult to store XML documents as tables in relational model. To solve these problems there have been significant researches in relational database systems. There are two kinds of approaches: 1) One way is to decompose XML documents so that elements of XML match fields of relational tables. 2) The other one stores a whole XML document as a field of relational table. In this paper we adopted the second approach to store XML documents because sometimes it is not easy for us to decompose XML documents and in some cases their element order in documents are very meaningful. We suggest an efficient table schema to store only inverted index as tables to retrieve required data from XML data fields of relational tables and shows SQL translations that correspond to XML full-text retrievals. The functionalities of XML retrieval are based on the W3C XQuery which includes full-text retrievals. In this paper we show the superiority of our method by comparing the performances in terms of a response time and a space to store inverted index. Experiments show our approach uses less space and shows faster response times.

XML 문서의 저장과 추출을 위한 색인 기법 (An Index Method for Storing and Extracting XML Documents)

  • 김우생;송정석
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.154-163
    • /
    • 2005
  • XML 문서를 위한 현재까지 연구된 대부분의 색인기법에서는 절대좌표를 표현하는 방법을 이용하기 때문에 갱신연산이 커다란 부담으로 받아들여지고 있다. 또한 이 기법에서 XML문서내의 엘리먼트, 애트리뷰트, 텍스트 사이의 상호 구조적 관계를 표현하려면 좌표를 재구성해야 한다. 이와 같은 재구성 작업은 갱신이 이루어지는 노드에 국한하지 않고 XML 문서 전반에 걸쳐 연쇄적으로 일어나기 때문에, XML 문서의 갱신이 빈번할 경우 심각한 성능 문제를 야기하게 된다. 본 연구에서는 갱신이 빈번한 상황에서도 성능 저하가 많지 않은 확장 색인에 기반한 색인 기법을 제안하고자 한다. 이 방법은 갱신으로 인한 트리의 재구성 연산에 참여하는 노드의 수를 제한하여 전체적으로 성능을 많이 향상시킬 수 있다. 또한 확장색인 기법은 SQL 문장을 이용한 간결한 표현을 통하여 포함관계질의를 처리할 수 있다.

  • PDF

교무업무시스템을 위한 데이터베이스 암호화 구현 및 성능 평가 (Implementation and Performance Evaluation of Database Encryption for Academic Affairs System)

  • 김보선;홍의경
    • 한국멀티미디어학회논문지
    • /
    • 제11권1호
    • /
    • pp.1-12
    • /
    • 2008
  • 데이터베이스 암호화시스템은 데이터를 암호화하여 저장함으로 내부 관리자나 외부 해커로부터 데이터 유출 시 내용을 보호할 수 있는 중요한 수단중의 하나이다. 그러나 암호화시스템은 질의처리 시 자주 발생하는 암복호화로 성능상의 문제가 발생할 수 있어 이를 고려하여 개발되어야 한다. 본 논문에서는 데이터베이스 암호화시스템 아키텍처와 데이터 암호화 처리기를 구축하고, 암호화 데이터 처리를 위한 SQL 질의어 확장에 관한 구현 사례를 제공한다. 성능 향상을 위해 암호키는 데이터베이스별 단일키로 제한하고 암호화 알고리즘으로는 한국표준 암호화 알고리즘들 중 성능이 빠른 ARIA를 채택하였다. 데이터베이스에 대한 성능 평가 관련 연구는 현재까지 매우 미흡한 실정이다. 본 논문에서 구축한 데이터베이스 암호화시스템을 바탕으로 다양한 동시 사용자수와 서버 환경에 대해 암호문과 평문의 처리 성능을 측정한 결과를 제시한다.

  • PDF

A Study on the DB-IR Integration: Per-Document Basis Online Index Maintenance

  • Jin, Du-Seok;Jung, Hoe-Kyung
    • Journal of information and communication convergence engineering
    • /
    • 제7권3호
    • /
    • pp.275-280
    • /
    • 2009
  • While database(DB) and information retrieval(IR) have been developed independently, there have been emerging requirements that both data management and efficient text retrieval should be supported simultaneously in an information system such as health care, customer support, XML data management, and digital libraries. The great divide between DB and IR has caused different manners in index maintenance for newly arriving documents. While DB has extended its SQL layer to cope with text fields due to lack of intact mechanism to build IR-like index, IR usually treats a block of new documents as a logical unit of index maintenance since it has no concept of integrity constraint. However, In the DB-IR integrations, a transaction on adding or updating a document should include maintenance of the posting lists accompanied by the document. Although DB-IR integration has been budded in the research filed, the issue will remain difficult and rewarding areas for a while. One of the primary reasons is lack of efficient online transactional index maintenance. In this paper, performance of a few strategies for per-document basis transactional index maintenance - direct index update, pulsing auxiliary index and posting segmentation index - will be evaluated. The result shows that the pulsing auxiliary strategy and posting segmentation indexing scheme, can be a challenging candidates for text field indexing in DB-IR integration.