نظرة عامة على هندسة التخزين HBase

هناك بنية HBase Storage تضم العديد من المكونات. دعونا نلقي نظرة على وظائف هذه المكونات ونعرف كيفية كتابة البيانات.

Apache HBase هي قاعدة بيانات مفتوحة المصدر وموزعة وغير علائقية تم تصميمها على غرار Bigtable من Google ومكتوبة بلغة جافا. يوفر إمكانات مشابهة لـ Bigtable أعلى Hadoop و HDFS (نظام الملفات الموزعة Hadoop) ، أي أنه يوفر طريقة تتسامح مع الأخطاء لتخزين كميات كبيرة من البيانات المتناثرة ، وهو أمر شائع في العديد من حالات استخدام البيانات الضخمة. يتم استخدام HBase للوصول إلى البيانات الضخمة للقراءة / الكتابة في الوقت الفعلي.





تشتمل بنية HBase Storage على العديد من المكونات. دعونا نلقي نظرة على وظائف هذه المكونات ومعرفة كيفية كتابة البيانات.

ملفات H:



تشكل ملفات HFiles المستوى المنخفض من بنية HBase. ملفات HFiles هي ملفات تخزين تم إنشاؤها لتخزين بيانات HBase بسرعة وكفاءة.

HMaster:

HMaster هي المسؤولة عن تعيين المناطق لكل HRegionServer عند بدء HBase. وهي مسؤولة عن إدارة كل ما يتعلق بالصفوف والجداول وأنشطة التنسيق الخاصة بهم. يحتوي Hmaster أيضًا على تفاصيل البيانات الوصفية.



مكونات عدد HBase:

يحتوي HBase على المكونات التالية:

  • الجدول - يشمل المناطق
  • المنطقة - نطاق الصفوف المخزنة معًا
  • خوادم المنطقة - يخدم منطقة واحدة أو أكثر
  • Master Server - Daemon هو المسؤول عن إدارة مجموعة HBase

تقوم HBase بتخزين البيانات مباشرة في HDFS وتعتمد بشكل كبير على التوفر العالي والتسامح مع الخطأ في HDFS.

بنية تخزين HBase:

هندسة التخزين HBase

التدفق العام هو أن العميل يتصل بـ Zookeeper أولاً للعثور على مفتاح صف معين. يقوم بذلك عن طريق استرداد اسم الخادم من Zookeeper. باستخدام هذه المعلومات ، يمكنه الآن الاستعلام عن هذا الخادم للحصول على الخادم الذي يحتوي على جدول بيانات. يتم تخزين كل من هذه التفاصيل مؤقتًا ويتم البحث عنها مرة واحدة فقط. أخيرًا ، يمكنه الاستعلام عن خادم التعريف واسترداد الخادم الذي يحتوي على الصف الذي يبحث عنه العميل.

بمجرد أن يعرف المنطقة التي يوجد بها الصف ، فإنه يخزن هذه المعلومات مؤقتًا أيضًا ويتصل بخادم HRegionServer مباشرةً. لذلك ، بمرور الوقت ، يكون لدى العميل معلومات كاملة عن مكان الحصول على الصفوف دون الحاجة إلى الاستعلام عن خادم التعريف مرة أخرى. عندما يتم فتح HRegion ، فإنه يقوم بإعداد مثيل Store لكل HColumnFamily لكل جدول. تتم كتابة البيانات عندما يصدر العميل طلبًا إلى HRegionServer الذي يوفر التفاصيل لمثيل HRegion المطابق. الخطوة الأولى هي أنه يتعين علينا أن نقرر ما إذا كان يجب كتابة البيانات أولاً إلى 'Write-Ahead-Log' (WAL) التي تمثلها فئة HLog. يعتمد القرار على العلم الذي وضعه العميل.
بمجرد كتابة البيانات في WAL يتم وضعها في MemStore. في نفس الوقت ، يتم فحص Memstore لمعرفة ما إذا كان ممتلئًا وفي هذه الحالة يتم طلب تدفق إلى القرص. ثم يتم كتابة البيانات في ملف HFile.

لديك سؤال لنا؟ أذكرها في قسم التعليقات وسنعاود الاتصال بك.

المنشورات ذات الصلة

رؤى حول HBase Architecture

إطار عمل يحركها الكلمات الرئيسية في السيلينيوم