نماذج بيانات الخلية

تحتوي نماذج بيانات الخلية على المكونات التالية مثل قواعد البيانات والجداول والأقسام والمستودعات أو المجموعات. تدعم الخلية الأنواع الأولية مثل الأعداد الصحيحة والعائمة والمزدوجة والسلاسل النصية.

لوحة سطح المكتب 9 مشارك مؤهل

Hive هو نظام مستودع بيانات لـ Hadoop يسهل تلخيص البيانات بسهولة ، والاستعلامات المخصصة ، وتحليل مجموعات البيانات الكبيرة المخزنة في أنظمة الملفات المتوافقة مع Hadoop. Hive يقوم ببناء البيانات في مفاهيم قواعد بيانات مفهومة جيدًا مثل الجداول والصفوف والأعمدة والأقسام. وهو يدعم الأنواع البدائية مثل عدد صحيح ، عوامات ، زوجي ، وسلاسل. يدعم Hive أيضًا المصفوفات الترابطية والقوائم والبنى وتستخدم واجهة برمجة التطبيقات المتسلسلة وإلغاء التسلسل لنقل البيانات داخل وخارج الجداول.





دعونا نلقي نظرة على نماذج بيانات الخلية بالتفصيل

نماذج بيانات الخلية:

تحتوي نماذج بيانات الخلية على المكونات التالية:



  • قواعد بيانات
  • الجداول
  • أقسام
  • دلاء أو عناقيد

أقسام:

القسم يعني تقسيم الجدول إلى أجزاء ذات حبيبات خشنة بناءً على قيمة عمود القسم مثل 'البيانات'. هذا يجعل من الأسرع القيام بالاستعلامات على شرائح البيانات

نماذج بيانات الخلية

إذن ، ما هي وظيفة التقسيم؟ تحدد مفاتيح التقسيم كيفية تخزين البيانات. هنا ، تحدد كل قيمة فريدة لمفتاح التقسيم قسمًا من الجدول. تمت تسمية الأقسام بعد التواريخ من أجل الملاءمة. إنه مشابه لـ 'Block Splitting' في HDFS.



دلاء:

توفر المجموعات بنية إضافية للبيانات التي يمكن استخدامها للاستعلامات الفعالة. يمكن تنفيذ صلة لجدولين تم تجميعهما في نفس الأعمدة ، بما في ذلك عمود الصلة كوصلة جانب الخريطة. الحزم بواسطة المعرف المستخدم يعني أنه يمكننا تقييم استعلام مستند إلى المستخدم بسرعة من خلال تشغيله على عينة عشوائية من المجموعة الإجمالية للمستخدمين.

برنامج تعليمي للاستوديو المرئي للمبتدئين

لديك سؤال لنا؟ يرجى ذكرها في قسم التعليقات وسنعاود الاتصال بك.

المنشورات ذات الصلة:

برنامج تعليمي للبيانات الضخمة للمبتدئين

أوامر خلية مفيدة