• 제목/요약/키워드: Sentence simplification

검색결과 7건 처리시간 0.02초

문장추상화 : 개념추상화를 도입한 문장교열 (Sentence ion : Sentence Revision with Concept ion)

  • 김곤;양재곤;배재학;이종혁
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.563-572
    • /
    • 2004
  • 문장추상화(Sentence Abstraction)는 문장의 의사전달 기능이 보존된 단순화이다. 이는 문장교열(Sentence Revision)과 개념추상화(Concept Abstraction)를 동시에 가능하게 한다. 문장교열은 사람이 생각한 바와 문장으로 표현된 의미의 차이를 해결하는 방법이다. 개념추상화는 개념들의 공통된 요소로부터 얻은 보편적인 관념을 표현하는 것이다. 문장추상화는 문장의 주요구성성분들을 선별해 내고, 이들의 의미적인 정보를 파악하여 상위개념을 표현함으로써 문장교열과 개념추상화를 가능하게 한다. 본 논문에서는 문장추상화를 위한 구문분석기 LGPI+와, 온톨러지 OfN을 구체화하였다. 문장추상기 SABOT는 LGPI+와 OfN을 활용하며, 구문분석 결과를 처리하여 문장에서 추상화 할 후보난어를 선택한다. 문장추상화를 활용한 원문이해 시스템으로 23개 이야기의 58개 문단에 대해 중요 문장에 대한 문장재현율과 선별된 문장들의 주제관련성을 확인해 보았다. 실험결과, 문장재현율은 54~72%의 범위이었고, 주제관련성은 76~86% 정도의 비율로 나타났다. 이를 유사 시스템과 비교해 보았을 때, 약 10~20% 정도의 성능향상을 보인다. 본 논문에서는 문장추상화를 활용하여 글의 화제문을 효율적으로 선택할 수 있는 문장교열과 원문의 이해심도를 보다 더 깊게 할 수 있는 개념추상화가 가능함을 확인하였다.

한국 신문의 영어 번역에 나타난 번역 보편소의 코퍼스 기반 분석 (A Corpus-based Study of Translation Universals in English Translations of Korean Newspaper Texts)

  • 고광윤;이영희
    • 비교문화연구
    • /
    • 제45권
    • /
    • pp.109-143
    • /
    • 2016
  • 본 연구는 번역된 텍스트들에 전형적으로 나타나는 언어적 특성들인 번역 보편소(translation universals)에 관한 코퍼스 기반 연구이다. 지금까지의 번역 보편소 연구는 언어계통상 서로 밀접한 관련이 있는 영어와 다른 유럽어 사이의 번역에 집중되어 왔으며, 다른 한편으로 주로 문학 장르의 분석에 치중되어 있다는 아쉬움을 지닌다. 본 연구에서는 관련 연구가 지닌 이러한 두 가지 주요 문제점을 보완하고자 하는 노력의 일환으로 한국어를 원문으로 하는 영어 번역 가운데 비문학 장르인 신문언어 텍스트를 분석대상으로 선택하였다. 먼저, 번역된 신문영어 텍스트와 비번역 신문영어 텍스트를 정해진 기준에 따라 수집하여 번역과 비번역 영어(translated and non-translated English)로 구성된 대응코퍼스(comparable corpora)를 구축하였다. 이렇게 구축된 대응 코퍼스를 바탕으로 기존 문헌에서 논의된 번역 보편소 가설 가운데 가장 대표적인 단순화(simplification), 명시화(explicitation), 규범화(normalization), 평준화(leveling-out) 현상이 한국어 신문의 영어 번역 텍스트에서 어떠한 양상을 보이는지 살펴봄으로써 각 가설들이 지니는 타당성을 검증해보고자 하였다. 본 연구의 분석결과를 종합해보면, 단순화와 규범화를 제외한 나머지 하위가설의 언어적 특성들은 모든 언어쌍과 모든 텍스트 장르에 걸쳐 일반화하기에 다소 한계가 있는 것으로 나타났다. 또한, 번역 보편소의 개념 규정이나 분석지표의 정교화, 그리고 결과의 일반화에는 신중한 접근이 필요할 것으로 보인다.

The English Cause-Focused Causal Construction

  • Kim, Yangsoon
    • International Journal of Advanced Culture Technology
    • /
    • 제8권4호
    • /
    • pp.161-166
    • /
    • 2020
  • The primary aim of this paper is to analyze the resultative adjunct clause, i.e., (thus/thereby/hence) ~ing participle and provide explicit syntactic, semantic and sociolinguistic explanation on the question what causes the cause-focused causal construction with resultative (thus/thereby/hence) ~ing participle in English. What comes first is either cause or effect clause. This study explores the recent style shift of causal constructions from the effect-focused pattern to the cause-focused pattern. In this study, we argue that the increasing number of the cause-focused main clause with a resultative ~ing participle clause shows the process of the style evolution improving speech/wring style in many respects including syntactic simplification, clarification of the sentence meaning with impact on the focused clauses, and improvement of the flow of speech/writing. The style shift found in the English resultative adjunct clauses, i.e., (thus/hence/thereby) ~ing participle constructions prove to be the style evolution from syntactic, semantic and sociolinguistic point of views.

한베 통계기계번역의 성능 향상을 위한 내포문 추출 및 복원 기법 (Embedded clause extraction and restoration for the performance enhancement in Korean-Vietnamese statistical machine translation)

  • 조승우;김영길;권홍석;이의현;이원기;조형미;이종혁
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.280-284
    • /
    • 2016
  • 본 논문에서는 기호로 둘러싸인 내포문이 포함된 문장의 번역 성능을 높이는 방법을 제안한다. 입력 문장에서 내포문을 추출하여 여러 문장으로 나타내고, 각각의 문장들을 번역한다. 그리고 번역된 문장들을 복원정보를 활용하여 최종 번역 문장을 생성한다. 이러한 방법론은 입력 문장의 길이를 줄여주며, 그로 인하여 문장 구조가 단순해져 번역 품질이 향상된다. 본 논문에서는 한국어-베트남어 통계 기반 번역기에 대하여 제안한 방법론을 적용하고 실험하였다. 그 결과 BLEU 점수가 약 1.5 향상된 것을 확인할 수 있었다.

  • PDF

한베 통계기계번역의 성능 향상을 위한 내포문 추출 및 복원 기법 (Embedded clause extraction and restoration for the performance enhancement in Korean-Vietnamese statistical machine translation)

  • 조승우;김영길;권홍석;이의현;이원기;조형미;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.280-284
    • /
    • 2016
  • 본 논문에서는 기호로 둘러싸인 내포문이 포함된 문장의 번역 성능을 높이는 방법을 제안한다. 입력 문장에서 내포문을 추출하여 여러 문장으로 나타내고, 각각의 문장들을 번역한다. 그리고 번역된 문장들을 복원정보를 활용하여 최종 번역 문장을 생성한다. 이러한 방법론은 입력 문장의 길이를 줄여주며, 그로 인하여 문장 구조가 단순해져 번역 품질이 향상된다. 본 논문에서는 한국어-베트남어 통계 기반 번역기에 대하여 제안한 방법론을 적용하고 실험하였다. 그 결과 BLEU 점수가 약 1.5 향상된 것을 확인할 수 있었다.

  • PDF

소설텍스트의 난이도 조정 방안 연구 -이효석의 「메밀꽃 필 무렵」을 중심으로- (This study revises Lee Hyo-seok's The Buckwheat Season, utilizing Novel Corpus, intermediate learners' level)

  • 황혜란
    • 한국어교육
    • /
    • 제29권4호
    • /
    • pp.255-294
    • /
    • 2018
  • The Buckwheat Season, evaluated as the best of Lee Hyo-seok's literature, is one of the short stories that represent Korean literature. However, vivid literary expressions such as lyrical and beautiful depictions, figurative expressions and dialects, which show the Korean beauty, rather make learners have difficulty and become a factor that fails in reading comprehension. Thus, it is necessary to revise and present the text modified for the learners' language level. The methods of revising a literary text include the revision of linguistic elements such as cryptic vocabulary or sentence structure and the revision of the composition of the text, e.g. suggestion of characters or plot, or insertion of illustration. The methods of revising the language of the text can be divided into methods of simplification and detailing. However, in the process of revising the text, many depend on the adapter's subjective perception, not revising it with objective criteria. This paper revised the text, utilizing by the Academy of Korean Studies, , and the by the National Institute of Korean Language to secure objectivity in revising the text.

한국어사에서 20세기 초 한국어의 위상과 문법 특징 (Historic Status and Grammatical Characteristics of Korean language in the Early 20th Century)

  • 홍종선
    • 한국어학
    • /
    • 제71권
    • /
    • pp.1-22
    • /
    • 2016
  • The early 20th century is a period of time when Korea confronted with the surging waves of modernization, and made a variety of internal reactions. The Korean language, not immune to the upheaval, also experienced new changes and gradually gained characteristics of today's Korean. Although scholars have not yet fully agreed upon the time division of Korean, Gabo reformation (1896) is usually considered to be the beginning of modern Korean. Thus, the early 20th century was also the beginning of modern Korean. Phonological, lexical, and grammatical characteristics of modern day Korean began to appear during this period of time. Phonologically, the 10 vowel system was established, glottal sounds and aspirated sounds increased, vowel harmony declined. Phenomena such as vowel raising, front-vowelization, monophthongization, and the word-initial rule appeared. Meanwhile, hangul-Chinese mix writing became common practice, and hangul-only writing also started to take place in narrative writing, and elements of spoken language began to reflect in written language. All those pointed to the unification of written and spoken language. Under the influence of modernization, a great amount of new words appeared. Especially, Japanese and other foreign words flooded in in great quantities. Grammatically, '-eos-(-엇-), -neun-(-는-), -ges-(-겟-)' trichotomy system of tenses was established, and hearer-oriented honorific system also formed a binary system of 'hasoseo(하소서), hasibsio(하십시오), hao(하오), hage(하게), haera(해라)' and 'hae (해), haeyo(해요)'. In word formation and sentence construction, the use of '-gi(-기)' became more frequent than '-eum(-음)', while '~geot(~것)' also significantly increased. In negative, causative and passive expressions, the use of long form, which has fewer restrictions than the short form, became more frequent. A tendency towards simplicity appeared. In the same vain, long and complex sentences with several clauses tend to be avoided. Instead, short simple sentences became more favorable. Korean linguistics scholars should pay closer attention to the modernization period, which includes the early 20th century. In order to fully understand today's Korean language, more thorough research on this immediately preceding period is necessary.