DOI QR코드

DOI QR Code

A Voice-Annotation Technique in Mobile E-book for Reading-disabled People

독서장애인용 디지털음성도서를 위한 음성 어노테이션 기법

  • 이경희 (숙명여자대학교 멀티미디어과학과) ;
  • 이종우 (숙명여자대학교 멀티미디어과학과) ;
  • 임순범 (숙명여자대학교 멀티미디어과학과)
  • Received : 2011.07.21
  • Accepted : 2011.09.14
  • Published : 2011.09.30

Abstract

Digital talking book has been developed to enhance reading experiences for reading-disabled people. In the existing digital talking book, however, annotations can be created only through the screen interfaces. Screen annotation interfaces is of no use for reading-disabled people because they need reader's eyesight. In this paper, we suggest a voice annotation technique can create notes and highlights at any playing time by using hearing sense and voice command. We design a location determination technique that pinpoints where a voice annotation should be placed in the playing sentences. To verify the effectiveness of our voice annotation technique, we implement a prototype in an android platform. We can find out by the black-blindfolded users testing that our system can perfectly locate the exact position that a voice annotation should be placed into.

디지털 음성 도서는 독서장애인의 독서 환경 개선을 위해 개발되었다. 그러나 기존 디지털 음성 도서에서의 어노테이션 기능(도서에 노트나 하이라이트 등의 주석을 표기하는 행위)은 시력을 필요로 하는 화면 인터페이스를 통해서만 가능했기 때문에 독서장애인들에게는 무용지물이었던 것이 사실이다. 이에 본 논문에서는 듣는 능력과 음성만으로도 노트나 하이라이트 달기 같은 어노테이션 기능을 가능하게 해주는 음성 어노테이션 기법을 제안한다. 디지털음성도서 재생 중 입력된 음성 어노테이션이 어느 문장에 해당하는 것인지를 결정하는 기법을 설계하였으며, 이의 효용성을 검증하기 위해 안드로이드 환경에서 구현하였다. 눈가리개를 착용한 복수의 실험자들을 대상으로 실험한 결과 실험자들이 의도했던 위치에 정확히 어노테이션이 삽입된다는 것을 확인하였다.

Keywords

References

  1. 정필모, "문헌정보학원론", 구미무역(출판사), pp. 254-257, 1996.
  2. Catherine C. Marshall, "Annotation: From Paper Books to Digital Library, Proceedings of the 2nd ACM International Conference on Digital Libaries", Philadelphia, pp. 40-49, 1997
  3. Google Speech API, "http://developer.android.com/sdk/index.html"
  4. Lin, J., Newman, M., Hong, J. I., and Landay, J. A., "DENIM: Finding a Tighter Fit Between Tools and Practice for Web Site Design." To be published in Conference Proceedings on Human Factors in Computing Systems: CHI 2000.
  5. Christoph Draxler, "WebTranscribe: An Extensible Web-Based Speech Annotation Framework", Springer Volume: 3658, pp. 61-68, 2005
  6. Digital Talking Book 표준, "http://committee.tta.or.kr/data/standard_view.jsp?nowPage=27&firstDepthCode=TC4&pk_num=TTAS.OT-09.0001&commit_code=TC4"
  7. bookmark-2005-1.dtd, "http://www.daisy.org/z3986/2005/bookmark-2005-1.dtd"
  8. AMIS, "http://www.daisy.org/amis"
  9. EasyReader, "http://www.yourdolphin.com/productdetail.asp?id=9"
  10. DAISY Consortium, "http://www.daisy.org"
  11. Dolphin, "http://www.yourdolphin.com"
  12. android-daisy-epub-reader, "http://code.google.com/p/android-daisy-epub-reader"
  13. Miller G.A., "The Magical Number Seven", Plus or Minus Two: Some Limits on our Capacity for Processing Information. Psychological Review, pp. 81-97, 1956
  14. 한광희 외, "인지과학", 학지사, 2000
  15. ETRI, "http://www.etri.re.kr"
  16. Corpus HMM, "http://htk.eng.cam.ac.uk/"