DOI QR코드

DOI QR Code

Search Performance Improvement of Column-oriented Flash Storages using Segmented Compression Index

분할된 압축 인덱스를 이용한 컬럼-지향 플래시 스토리지의 검색 성능 개선

  • Byun, Siwoo (Department of Digital Media, Anyang University)
  • 변시우 (안양대학교 디지털미디어학과)
  • Received : 2012.07.24
  • Accepted : 2013.01.10
  • Published : 2013.01.31

Abstract

Most traditional databases exploit record-oriented storage model where the attributes of a record are placed contiguously in hard disk to achieve high performance writes. However, for search-mostly datawarehouse systems, column-oriented storage has become a proper model because of its superior read performance. Today, flash memory is largely recognized as the preferred storage media for high-speed database systems. In this paper, we introduce fast column-oriented database model and then propose a new column-aware index management scheme for the high-speed column-oriented datawarehouse system. Our index management scheme which is based on enhanced $B^+$-Tree achieves high search performance by embedded flash index and unused space compression in internal and leaf nodes. Based on the results of the performance evaluation, we conclude that our index management scheme outperforms the traditional scheme in the respect of the search throughput and response time.

대부분의 기존 데이터베이스들은 빠른 저장 성능을 얻기 위하여 한 레코드의 속성들을 하드 디스크에 연속적으로 배치하는 레코드-지향 저장 모델을 사용하였다. 하지만 검색이 대부분인 데이터웨어하우스 시스템에는 월등한 읽기 성능 때문에 컬럼-지향 저장 방식이 적합한 모델이 되고 있다. 또한, 현재 플래시 메모리가 고속 데이터베이스 시스템을 위한 선호 저장 매체로 인정되고 있다. 본 논문에서는 고속 컬럼-지향 데이터베이스 모델을 도입하고, 고속 컬럼-지향 데이터웨어하우스 시스템을 위한 컬럼-인지 인덱스 관리 기법을 제안한다. 본 인덱스 관리 기법은 개선된 B트리에 기반하며, 중간 노드와 리프노드에서 내장 플래시 인덱스와 빈공간 압축을 통하여 높은 검색 성능을 얻는다. 성능 평가 결과를 기반으로 본 인덱스 관리 기법이 기존 기법보다 검색 처리 및 응답 시간 측면에서 더 우수함을 확인하였다.

Keywords

References

  1. A. Wang, G. Kuenning, P. Reiher, and G. Popek "The Conquest File System: Better Performance Through a Disk/Persistent-RAM Hybrid Design", ACM Transac. on Storages, Vol. 2, No. 3, pp. 309-348, 2006. DOI: http://dx.doi.org/10.1145/1168910.1168914
  2. S. Byun, M. Hur, and H. Hwang, "An index rewriting scheme using compression for flash memory database systems" Journal of Information Science, Vol. 33, No.4, pp. 398-415, 2007. DOI: http://dx.doi.org/10.1177/0165551506076331
  3. Y. Chang, J. Hsieh, and T. Kuo, "Endurance Enhancement of Flash-Memory Storage System: An Efficient Static Wear Leveling Design", Proc. 44th conference on Design automation, San Diego, USA, pp. 212-217, 2007.
  4. D. Abadi, S. Madden, and M. Ferreira, "Integrating compression and execution in column-oriented database systems", In SIGMOD, pp. 671-682, 2006.
  5. D. Abadi, D. Myers, D. DeWitt, and S. Madden, "Materialization strategies in a column-oriented dbms", MIT CSAIL Technical Report. MIT-CSAIL-TR-2006-078, 2006.
  6. A. Halverson, J. Beckmann, and J. Naughton, "A comparison of c-store and row-store in a common framework", Technical Report, UW Madison Department of CS, TR1566, 2006.
  7. S. Harizopoulos, V. Liang, D. J. Abadi, and S. Madden, "Performance tradeoffs in read-optimized databases", In VLDB, pp. 487-498, 2006.
  8. M. Stonebraker, D. J. Abadi, A. Batkin, X. Chen, M. Cherniack, M. Ferreira, E. Lau, A. Lin, S. Madden, E. J. O'Neil, P. E. O'Neil, A. and S. B. Zdonik. "C-store: A column-oriented dbms" In VLDB, 2005, pp. 553-564.
  9. S. Byun, "Flash Node Caching Scheme for Hybrid Hard Disk Systems", Journal of the Korea Academia-Industrial cooperation Society, Vol. 9, No. 6, pp. 1696-1704, 2008. https://doi.org/10.5762/KAIS.2008.9.6.1696
  10. A. Roberts, T. Kgil, and T. Mudge, "Integrating NAMD Flash Devices onto Servers", Communications of the ACM, Vol.52, No.4, pp. 98-106, 2009. DOI: http://dx.doi.org/10.1145/1498765.1498791
  11. Oberhumer, "LZO a real-time data compression library", http://www.oberhumer.com/opensource/lzo/lzodoc.php
  12. Mesquite, "CSIM2.0 Development Toolkit for Simulation & Modeling", http://www.mesquite.com/documentation/documents/CSIM20_User_Guide-C.pdf, 2012.