تثبيت Apache Pig على Linux



هذه المدونة عبارة عن دليل خطوة بخطوة لتثبيت Apache Pig على بيئة Linux. سنقوم بتثبيت Apache Pig 0.16.0 وتشغيله في أوضاع مختلفة.

في هذا المنشور سأتحدث عنه تثبيت Apache Pig على Linux . لنبدأ بالتعريف الأساسي لكل من Apache Pig و Pig Latin.

اباتشي خنزير هي أداة / منصة لإنشاء وتنفيذ برنامج Map Reduce المستخدم مع Hadoop. إنها أداة / منصة لتحليل مجموعات كبيرة من البيانات. يمكنك القول ، Apache Pig هو تجريد على MapReduce. اعتاد المبرمجون الذين ليسوا جيدين في Java أن يكافحوا العمل على Hadoop ، بشكل رئيسي أثناء كتابة وظائف MapReduce.لذا ، فهو موضوع مهم يجب تعلمه وإتقانه .Apache Pig لها لغتها الخاصة خنزير اللاتينية وهو نعمة للمبرمجين الفقراء.





ستساعدك مقدمة أساسية لـ Pig Latin على فهم أفضل:

يتم استدعاء اللغة الإجرائية عالية المستوى المستخدمة في منصة Apache Pig خنزير اللاتينية . يتميز Apache Pig بـ 'Pig Latin' وهي لغة أبسط نسبيًا يمكن تشغيلها عبر مجموعات البيانات الموزعة على نظام ملفات Hadoop (HDFS). في Apache Pig ، تحتاج إلى كتابة نصوص Pig باستخدام لغة Pig Latin ، والتي يتم تحويلها إلى وظيفة MapReduce عندما تقوم بتشغيل برنامج Pig النصي. لدى Apache Pig عوامل تشغيل مختلفة تستخدم لأداء المهام مثل القراءة والكتابة ومعالجة البيانات. للتعرف على مشغلي Apache Pig ، انتقل إلى مدونتنا ' العوامل في Apache Pig: الجزء الأول - العوامل العلائقية '.

الآن بعد أن أصبح لديك فهم أساسي لـ Apache Pig ، فلنبدأ بتثبيت Apache Pig على Linux.



تثبيت Apache Pig على Linux:

فيما يلي خطوات تثبيت Apache Pig على نظام Linux (ubuntu / centos / windows باستخدام Linux VM). أنا أستخدم Ubuntu 16.04 في الإعداد أدناه.

الخطوة 1: تحميل خنزير قطران ملف.

أمر: wget http://www-us.apache.org/dist/pig/pig-0.16.0/pig-0.16.0.tar.gz



تنزيل Pig - Pig Installation - Edureka

الخطوة 2: استخراج ملف قطران ملف باستخدام الأمر tar. في أمر القطران أدناه ، x يعني استخراج ملف أرشيف ، مع يعني تصفية أرشيف من خلال gzip ، F يعني اسم ملف أرشيف.

أمر: القطران - xzf خنزير - 0.16.0.tar.gz

أمر: ls

ما هو داكس في باور بي

الخطوه 3: تحرير ' .bashrc 'لتحديث متغيرات بيئة Apache Pig. نحن نضعه حتى نتمكن من الوصول إلى خنزير من أي دليل ، لا نحتاج إلى الذهاب إلى دليل الخنزير لتنفيذ أوامر الخنزير. أيضًا ، إذا كان أي تطبيق آخر يبحث عن Pig ، فسوف يتعرف على مسار Apache Pig من هذا الملف.

أمر: sudo gedit .bashrc

يضاف ما يلي في نهاية الملف:

# تعيين PIG_HOME

تصدير PIG_HOME = / home / edureka / pig-0.16.0
تصدير PATH = $ PATH: / home/edureka/pig-0.16.0/bin
تصدير PIG_CLASSPATH = $ HADOOP_CONF_DIR

تأكد أيضًا من تعيين مسار hadoop.

قم بتشغيل الأمر أدناه لإجراء تحديث التغييرات في نفس المحطة.

أمر: المصدر. bashrc

الخطوة الرابعة: تحقق من إصدار الخنزير. هذا لاختبار أن Apache Pig قد تم تثبيته بشكل صحيح. في حالة عدم حصولك على إصدار Apache Pig ، تحتاج إلى التحقق مما إذا كنت قد اتبعت الخطوات المذكورة أعلاه بشكل صحيح.

أمر: نسخة خنزير

الخطوة الخامسة :تحقق من تعليمات الخنزير لرؤية جميع خيارات أوامر الخنزير.

ماذا يعني __init__ في لغة بيثون

أمر: مساعدة الخنزير

الخطوة 6 :تشغيل Pig لبدء قذيفة الناخر. يستخدم Grunt shell لتشغيل البرامج النصية Pig Latin.

أمر: خنزير

إذا نظرت إلى الصورة أعلاه بشكل صحيح ، فإن Apache Pig لديها وضعان يمكن تشغيلهما فيهما ، حيث تختار افتراضيًا وضع MapReduce. الوضع الآخر الذي يمكنك من خلاله تشغيل Pig هو الوضع المحلي. دعني أخبرك المزيد عن هذا.

أوضاع التنفيذ في Apache Pig:

  • وضع MapReduce - هذا هو الوضع الافتراضي ، والذي يتطلب الوصول إلى مجموعة Hadoop وتثبيت HDFS. نظرًا لأن هذا وضع افتراضي ، فليس من الضروري تحديد علامة -x (يمكنك تنفيذ خنزير أو خنزير x mapreduce ). الإدخال والإخراج في هذا الوضع موجودان على HDFS.
  • وضع المحلي - مع الوصول إلى جهاز واحد ، يتم تثبيت جميع الملفات وتشغيلها باستخدام مضيف محلي ونظام ملفات. هنا يتم تحديد الوضع المحلي باستخدام 'علم -x' ( خنزير -x محلي ). المدخلات والمخرجات في هذا الوضع موجودة في نظام الملفات المحلي.

أمر: خنزير -x محلي

كيفية إنهاء برنامج جافا

يمكنك تصفح الفيديو أدناه لمشاهدة تثبيت Apache Pig على Linux:

تركيب Apache Pig | تثبيت الخنازير على لينكس | إدوريكا

الآن بعد أن انتهيت من تثبيت Apache Pig على Linux ، فإن الخطوة التالية للأمام هي تجربة بعض عوامل تشغيل Pig العلائقية على Pig Grunt shell. ومن ثم ، فإن المدونة التالية ' العوامل في Apache Pig: الجزء الأول - العوامل العلائقية سيساعدك على إتقان مشغلي الخنازير.

الآن بعد أن قمت بتثبيت Apache Pig على Linux ، تحقق من ملف من Edureka ، وهي شركة تعليمية موثوقة عبر الإنترنت مع شبكة تضم أكثر من 250000 متعلم راضٍ منتشرين في جميع أنحاء العالم. تساعد الدورة التدريبية لشهادة Edureka Big Data Hadoop المتعلمين على أن يصبحوا خبراء في مجال HDFS ، و Yarn ، و MapReduce ، و Pig ، و Hive ، و HBase ، و Oozie ، و Flume ، و Sqoop باستخدام حالات الاستخدام في الوقت الفعلي في مجال البيع بالتجزئة ، والوسائط الاجتماعية ، والطيران ، والسياحة ، والمالية

لديك سؤال لنا؟ يرجى ذكر ذلك في قسم التعليقات وسنعاود الاتصال بك.