كيفية تشغيل البرامج النصية Hive؟



هذا برنامج تعليمي حول كيفية تشغيل Hive Scripts. سيؤدي تشغيل هذا البرنامج النصي إلى تقليل الوقت والجهد الذي نبذله في كتابة كل أمر وتنفيذه يدويًا.

نظرًا لكونها حزمة تخزين بيانات مبنية على Hadoop ، يتم استخدام Apache Hive بشكل متزايد لتحليل البيانات واستخراج البيانات والنمذجة التنبؤية. تبحث المنظمات عن محترفين لديهم قبضة قوية . في هذا المنشور ، دعنا نلقي نظرة على كيفية تشغيل Hive Scripts. بشكل عام ، نستخدم البرامج النصية لتنفيذ مجموعة من العبارات مرة واحدة. تستخدم Hive Scripts إلى حد كبير بنفس الطريقة. سيقلل الوقت والجهد الذي نبذله في كتابة وتنفيذ كل أمر يدويًا.

يتم دعم Hive Scripts في Hive 0.10.0 والإصدارات السابقة. نظرًا لأنه تم تثبيت إصدار Hive 0.90 في CDH3 ، فلا يمكننا تشغيل Hive Scripts في CDH3. يمكنك تجربة الخطوات التالية في CDH4 لأنه يحتوي على نسخة Hive 0.10.0 مثبتة فيها. هل أنت على دراية بكيفية إنشاء نص Hive؟ إذا كان الجواب لا ، انقر فوق للحصول على مزيد من التوضيح.





Master-Hive-Now

الآن ، دعونا نرى كيفية كتابة البرامج النصية في Hive وتشغيلها في CDH4:



لوحة كيفية إنشاء مجموعة

الخطوة 1: كتابة نص Hive.

لكتابة Hive Script ، يجب حفظ الملف بامتداد .sql. افتح محطة طرفية في توزيعة Cloudera CDH4 وأعطي الأمر التالي لإنشاء Hive Script.
أمر: عينة sudo gedit.sql

عند تنفيذ الأمر أعلاه ، سيفتح الملف مع قائمة بجميع أوامر Hive التي يجب تنفيذها.



في هذا البرنامج النصي ، سيتم إنشاء جدول ووصف وسيتم تحميل البيانات واسترجاعها من الجدول.

1. إنشاء الجدول في الخلية:

أمر: إنشاء منتج جدول (معرّف المنتج: int ، اسم المنتج: سلسلة ، السعر: عائم ، فئة: سلسلة) تنسيق صفوف الحقول المحددة المنتهية بـ '،'

هنا ، المنتج هو اسم الجدول و {productid، productname، price، category} هي أعمدة هذا الجدول.

الحقول المنتهية بعلامة '،' تشير إلى أن الأعمدة في ملف الإدخال مفصولة بالرمز '،'.

بشكل افتراضي ، يتم فصل السجلات في ملف الإدخال بسطر جديد.

2. وصف الجدول:

أمر: وصف المنتج

3. تحميل البيانات في الجدول.

لتحميل البيانات في الجدول ، نحتاج أولاً إلى إنشاء ملف إدخال يحتوي على السجلات التي يجب إدراجها في الجدول.

لنقم بإنشاء ملف إدخال.

أمر: sudo gedit input.txt

هيكل برنامج جافا

قم بتحرير محتويات الملف كما هو موضح في الشكل.

4. استرجاع البيانات:

لاسترداد البيانات ، يتم استخدام الأمر select.

أمر: حدد * من المنتج

يستخدم الأمر أعلاه لاسترداد قيمة جميع الأعمدة الموجودة في الجدول. يجب أن يكون السيناريو كما هو موضح في الصورة أدناه.

الآن ، انتهينا من كتابة نص الخلية. يمكن الآن حفظ ملف sample.sql.

الخطوة 2: تشغيل Hive Script

ما يلي هو الأمر لتشغيل البرنامج النصي Hive:

أمر: خلية –f /home/cloudera/sample.sql

أثناء تنفيذ البرنامج النصي ، تأكد من وجود المسار الكامل لموقع ملف البرنامج النصي.

يمكننا أن نرى أن جميع الأوامر يتم تنفيذها بنجاح.

هذه هي الطريقة التي يتم بها تشغيل البرامج النصية Hive وتنفيذها في CDH4.

Hive هو عنصر حاسم في Hadoop ويمكن لخبرتك في Hive أن تمنحك وظائف Hadoop الأعلى أجراً! لدى Edureka دورة Hadoop منسقة خصيصًا تساعدك على إتقان مفاهيم مثل MapReduce و Yarn و Pig و Hive و HBase و Oozie و Flume و Sqoop. انقر على الزر أدناه لتبدأ.

لديك سؤال لنا؟ يرجى ذكرها في قسم التعليقات وسنعاود الاتصال بك.

المنشورات ذات الصلة:

تعيين مسار الفصل لجافا

أوامر الخلية

نماذج بيانات الخلية