انتخاب بانک‌ اطلاعاتی توزیع‌شده مناسب جهت رسیدن به بهترین عملکرد در مدیریت داده‏های حجیم

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشگاه جامع امام حسین(ع)

2 دانشجوی دکتری دانشگاه فردوسی

چکیده

انتخاب بانک اطلاعاتی مناسب با توجه به نیازمندی‏های هر برنامه همواره یکی از دغدغه‏های توسعه‌دهندگان است. بانک‏های اطلاعاتی انواع مختلفی دارند که مشهورترین آن‏ها بانک اطلاعاتی رابطه‏ای است. با افزایش استفاده از اینترنت که منجر به رشد سریع ایجاد داده‏ها و نیازمندی‏های جدید در حوزه داده‌های حجیم شد، این نوع بانک‏های اطلاعاتی در مدیریت داده‏های غیر ساخت‏یافته و حجیم عملکرد خوبی نداشتند. جهت مدیریت داده‌هایی با چنین ویژگی‌ها، بانک‌های اطلاعاتی کلید- مقدار، سندگرا، ستون گسترده و مبتنی بر گراف ارائه شده است. این بانک‌ها هر یک با رویکرد خاصی راه‌حل‌هایی را ارائه می‌کنند. بانک‏های اطلاعاتی چند مدلی با رویکرد چندگانه با این ویژگی‌ها ارائه شده‌اند که قادر هستند راه‌حل‌های هم‌زمان برای چندین نیاز را پشتیبانی نمایند. در این مقاله ابتدا با مبنا قرار دادن مدل رابطه‌ای و با ذکر یک مثال، ضمن تشریح ساختار و امکانات انواع بانک‌های غیر رابطه‌ای مذکور، مثال مربوطه با توجه به هر یک از این مدل‌ها ارائه شده است. سپس از هر نوع، چندین بانک معرفی کرده و یک بانک پرکاربرد را جهت مقایسه ساختار و ویژگی‌ها با یکدیگر انتخاب و عملکرد آن‌ها مورد بررسی قرار گرفته است. معیارهای اصلی مقایسه سرعت ذخیره‌سازی و بازیابی اطلاعات بوده و در ارائه نتایج سعی شده معیارهای ارزیابی با توجه به رویکردها و نیازهای مختلف مورد بررسی و ارزیابی قرار گیرند. هدف این مقاله ارائه نمونه برتر از بانک‌های اطلاعاتی غیر رابطه‌ای نیست، بلکه هدف پیشنهاد بانک غیر رابطه‌ای مناسب برای کسب کارایی در کاربردهای مختلف بر اساس نیازهای تعریف شده است.

کلیدواژه‌ها


عنوان مقاله [English]

Choosing the Right Distributed Database to Achieve the Best Performance in Management of Big Data

چکیده [English]

Selecting the appropriate database according to the requirements of each program is always a concern for developers. There are different types of databases among which the relational database is the most famous one. With the increasing use of the Internet, which led to the rapid growth of data and new requirements in the area of Big Data, this type of databases had a bad practice in the management of unstructured and large data. With such features to manage data, key-value, Document Oriented, Wide Column and graph-based databases are provided. Each of these Databases provides solutions with a specific approach. Multi-modal databases provided multiple approaches to these features that the solutions are able to support multiple requirements. In this paper, at first, emphasizing on the relational model and giving an example, along with describing the structure and features of a variety of NoSQL databases, we offer relevant examples with respect to each of these models. Then, we introduce a common database of any kinds of several banks to compare the structure and feature of each choice and evaluate their performance. The main criteria for comparing are the speed storage and retrieval of information, and in presenting the results of the evaluation criteria of the approach, it has been tried to test and evaluate different needs. The target of this article is not to provide a superior example of NoSQL databases, but to offer high suitable NoSQL database in various applications based on defined needs.

کلیدواژه‌ها [English]

  • Big Data
  • NoSQL Databases
  • Distributed Database
  1. A. Silberschatz, S. Sudarshan, and H. F. Korth, “Database System Concepts,” Sixth Edition,      McGraw-Hill, 2010.##
  2. H. Ishikawa, “Object-Oriented Database System Design and Implementation for Advanced Applications,” Computer Science Workbench Series, Springer Japan, 2005.##
  3. V. Srinivasan, B. Bulkowski, W. Chu, S. Sayyaparaju, A. Gooding, R. Iyer, A. Shinde, and T. Lopatic, “Aerospike: architecture of a real-time operational DBMS. Proc. VLDB Endow.,” vol. 9, no. 13, pp.     1389-1400, 2016.##
  4. J. M. Crump and M. E. Tirado, “System and method for aggregating query results in a fault-tolerant database management system,” Google Patents, 2016. https://www.google.com/patents/US20160246857.##
  5. B. Thuraisingham, “Multilevel Secure Database Management System,” US, Springer, 2009.##
  6. M. Davidson, E. Hom, and R. Parks, “Heterogeneous database management system,” Google Patents, 2011. https://www.google.com/patents/US8060470.##
  7. Zh. Guo, Zh. Zhang, E. P. Xing, and C. Faloutsos, “Multimodal Data Mining in a Multimedia Database Based on Structured Max Margin Learning,” ACM Transactions on Knowledge Discovery from Data, vol. 10, no. 3, Article 23, 2016.##
  8. C. Coronel and S. Morris, “Database Systems Design, Implementation, and management,” Computers Ser., United States of America, 12 Edition. 2016.##
  9. We are Social, “Digital in 2016 report,” [Online], Available: http://wearesocial.com/uk/special-reports/digital-in-2016. Company number 06629464, London, [Accessed: 27 February 2016].##
  10. L. Tay, “Inside eBay’s 90PB data warehouse,” [Online], Available: http://www.itnews.com.au/news/inside-ebay8217s-90pb-data-warehouse-342615, Accessed: 27 February 2016.##
  11. کشوری، سامان، نقوی، مهدی،. کشوری، ساناز،  معرفی، بررسی ومقایسه سیستم فایلهای توزیع شده، اولین همایش ملی فناوری های نوین رایانه و توسعه پایدار، دانشگاه شهید بهشتی، تهران، 1394.##
    1. E. A. Brewer, “Towards Robust Distributed Systems,” Proceedings of the nineteenth annual ACM symposium on Principles of distributed computing, Portland, Oregon, USA, P. 7, 2000.##
    2. S. Kempe, “UnQL: A Standardized Query Language for NoSQL Databases,” [Online], Available: http://www.dataversity.net/unql-a-standardized-query-language-for-nosql-databases/, (2012, March 29), [Accessed: 26 February 2016].##
    3. کشوری، سامان، جوادزاده، محمدعلی، نقوی، مهدی، ارزیابی و مقایسه کارایی پایگاه داده‌های کلید‏- مقدار با هدف انتخابِ مبتنی بر نیاز، مجله علوم رایانشی، شماره 6، 1396.##
      1. X. Yuan, X. Wang, C. Wang, C. Qian, and J. Lin, “Building an Encrypted, Distributed, and Searchable Key-value Store. Proceedings of the 11th ACM on Asia Conference on Computer and Communications Security (ASIA CCS '16),” ACM, New York, NY, USA, pp.   547-558, 2016.##
      2. J. Han, E. Haihong, et al., “Survey on NoSQL database,” Pervasive Computing and Applications (ICPCA), 2011 6th International Conference on Port Elizabeth, IEEE, pp. 363-366, 2011.##
      3. A. B. Angadi, A. B. Angadi, and K. C. Gull, “Growth of New Databases & Analysis of NOSQL Datastores,” International Journal of Advanced Research in Computer Science and Software Engineering, vol. 3, no. 6, 2013.##
      4. Solid IT gmbh (1), “DB-Engines Ranking of Key-value Stores,” [Online]. Available: http://db-engines.com/en/ranking/key-value+store, [Accessed: 27 February 2016].##
      5. M. Stonebraker, “SQL databases v. NoSQL databases,” Communications of the ACM,New York, NY, USA, vol. 53, no. 4, pp. 10-11, 2010.##
      6. solid IT gmbh (2), “DB-Engines Ranking of Document Stores,” [Online]. Available: http://db-engines.com/en/ranking/document+store, [Accessed: 27 February 2016].##
      7. J. Pokorný, “Database technologies in the world of big data,” Proceedings of the 16th International Conference on Computer Systems and Technologies (CompSysTech '15), Boris Rachev and Angel Smrikarov (Eds.). ACM, New York, NY, USA, pp. 1-12, 2015.##
      8. R. Hecht and S. Jablonski, “NoSQL evaluation: A use case oriented survey,” International Conference on Cloud and Service Computing (CSC) , Hong Kong, IEEE,  pp. 336 – 341, 2011.##
      9. A. Nowosielski, P. A. Kowalski, and P. Kulczycki, “The column-oriented data store performance considerations,” Federated Conference on Computer Science and Information Systems (FedCSIS), Gdansk, pp. 877-881, 2016.##
      10. Solid IT gmbh (3), “DB-Engines Ranking of Wide Column Stores,” [Online]. Available: http://db-engines.com/en/ranking/wide+column+store, [Accessed: 27 February 2016].##
      11. Solid IT gmbh (4), “DB-Engines Ranking of Graph DBMS,” [Online]. Available: http://db-engines.com/en/ranking/graph+dbms, [Accessed: 27 February 2016].##
      12. F. R. Oliveira and L. d. V. Cura, “Performance Evaluation of NoSQL Multi-Model Data Stores in Polyglot Persistence Applications,” In Proceedings of the 20th International Database Engineering & Applications Symposium (IDEAS '16), Evan Desai (Ed.). ACM, New York, NY, USA, pp. 230-235, 2016.##
      13. Mongo DB, Inc, “the most popular document stores,” [Online]. Available: https://Mongodb.com/, [Accessed: 27 March 2017].##
      14. Apache Software Foundation, “Wide-column store based on ideas of BigTable and DynamoDB,” [Online]. Available: https://cassandra.apache.org, [Accessed: 27 March 2017].##
      15. S. N. Swaminathan and R. Elmasri, “Quantitative Analysis of Scalable NoSQL Databases,” IEEE International Congress on Big Data (BigData Congress), San Francisco, CA, pp. 323-326, 2016.##
      16. Neo Technology, “Open source graph database,” [Online]. Available: https://neo4j.com, [Accessed: 27 March 2017].##
      17. OrientDB LTD, “Multi-model DBMS,” [Online]. Available: https://orientdb.com, [Accessed: 27 March 2017].##
      18. D. G. Chandra, “BASE Analysis of NoSQL Database,” Future Generation Computer Systems, vol. 52, pp.      13–21, 2015.##

 D.  Jayathilake, Ch. Sooriaarachchi and ET. Al., (2012). A study into the capabilities of NoSQL databases in handling a highly heterogeneous tree, Information and Automation for Sustainability (ICIAfS), IEEE 6th International Conference on Beijing, IEEE, 106 - 111.##

  1. کشوری، سامان. صابری، حسن و کشوری، ساناز. (1394)، نقش نظریهCAP  و همزیستی مسالمت‌آمیز در انتخاب بانک‌های اطلاعاتی، سومین کنفرانس بین المللی پژوهش‌های کاربردی در مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه تربیت مدرس، تهران.##