4 طرق لاستخدام R و Hadoop معًا



يكمل كل من R و Hadoop بعضهما البعض جيدًا من حيث التصور والتحليلات للبيانات الضخمة. يتحدث منشور المدونة هذا عن 4 طرق لاستخدامها معًا.

Hadoop هو إطار عمل برمجة قائم على جافا يدعم معالجة مجموعات البيانات الكبيرة في بيئة الحوسبة الموزعة ، بينما R هي لغة برمجة وبيئة برمجية للحوسبة والرسومات الإحصائية. تُستخدم لغة R على نطاق واسع بين الإحصائيين وعمال مناجم البيانات لتطوير البرامج الإحصائية وإجراء تحليل البيانات. في مجالات تحليل البيانات التفاعلية وإحصاءات الأغراض العامة والنمذجة التنبؤية ، اكتسبت R شعبية كبيرة بسبب تصنيفها وتجميعها وقدرات التصنيف.

KM





يكمل Hadoop و R بعضهما البعض جيدًا من حيث التصور والتحليلات للبيانات الضخمة.

باستخدام R و Hadoop

هناك أربع طرق مختلفة لاستخدام Hadoop و R معًا:



1. RHadoop

كيفية إنشاء المعلمة في الجدول

RHadoop عبارة عن مجموعة من ثلاث حزم R: rmr و rhdfs و rhbase. توفر حزمة rmr وظائف Hadoop MapReduce في R ، وتوفر rhdfs إدارة ملفات HDFS في R و rhbase توفر إدارة قاعدة بيانات HBase من داخل R. يمكن استخدام كل من هذه الحزم الأساسية لتحليل بيانات إطار عمل Hadoop وإدارتها بشكل أفضل.

2. أورش



ORCH تعني Oracle R Connector for Hadoop. وهي عبارة عن مجموعة من حزم R التي توفر الواجهات ذات الصلة للعمل مع جداول Hive والبنية الأساسية لحساب Apache Hadoop وبيئة R المحلية وجداول قاعدة بيانات Oracle. بالإضافة إلى ذلك ، يوفر ORCH أيضًا تقنيات تحليلية تنبؤية يمكن تطبيقها على البيانات الموجودة في ملفات HDFS.

3. ريب

RHIPE هي حزمة R توفر واجهة برمجة تطبيقات لاستخدام Hadoop. RHIPE تعني R و Hadoop بيئة البرمجة المتكاملة ، وهي أساسًا RHadoop بواجهة برمجة تطبيقات مختلفة.

تحويل مزدوج إلى int java

أربعة. Hadoop يتدفقون

Hadoop Streaming هي أداة تتيح للمستخدمين إنشاء وظائف وتشغيلها باستخدام أي ملفات تنفيذية مثل المخطط و / أو المخفض. باستخدام نظام البث ، يمكن للمرء تطوير وظائف Hadoop العاملة بمعرفة كافية بجافا لكتابة نصي شل يعملان جنبًا إلى جنب.

يظهر مزيج R و Hadoop كمجموعة أدوات لا غنى عنها للأشخاص الذين يعملون مع الإحصائيات ومجموعات البيانات الكبيرة. ومع ذلك ، فقد رفع بعض المتحمسين لبرنامج Hadoop علامة حمراء أثناء التعامل مع أجزاء كبيرة جدًا من البيانات الضخمة. يزعمون أن ميزة R لا تكمن في بناء الجملة بل المكتبة الشاملة للأولويات للتصور والإحصاءات. هذه المكتبات غير موزعة بشكل أساسي ، مما يجعل استرداد البيانات عملية تستغرق وقتًا طويلاً. هذا عيب متأصل في R ، وإذا اخترت التغاضي عنه ، فلا يزال بإمكان R و Hadoop جنبًا إلى جنب عمل العجائب.

الآن ، دعونا نرى العرض التوضيحي:

لديك سؤال لنا؟ يرجى ذكرها في قسم التعليقات وسنعاود الاتصال بك.

كيفية تحويل ثنائي إلى عشري في جافا

المنشورات ذات الصلة: