ما هي المصطلحات الأساسية في Hadoop Security؟



تساعدك مدونة Edureka هذه في الحصول على معرفة مفصلة وشاملة حول أمان hadoop الذي يتم تنفيذه في الوقت الفعلي.

مصدر قلق كبير عندما يتعلق الأمر بالتعامل مع البيانات السرية. كونه الأفضل في عمليات معالجة البيانات يواجه نفس المشكلة. ليس لديها أمنها الخاص. دعونا نفهم كيف تم حل المشكلة من خلال هذا Hadoop الأمن مقالة - سلعة.

لماذا نحتاج Hadoop Security؟

hadoop-security-لماذا يعتبر أمن hadoop مهمًا





هو إطار معالجة البيانات الضخمة الأقوى والأكثر قابلية للتوسع والقادر على القيام بذلك أزمة بيتابايت من البيانات بسهولة. نظرًا لقدراته التي لا مثيل لها ، في ذلك الوقت ، بدأ كل قطاع أعمال ، وإدارات الصحة والعسكرية والمالية في استخدام Hadoop.

هادوب بدأت تكتسب شعبية. هذا عندما وجد مطورو Hadoop ملف سوء تقدير هائل. يفتقر Hadoop إلى برنامج أمان مخصص داخله. أثر هذا على العديد من المناطق التي كان يستخدم Hadoop فيها.



  • قطاعات أعمال متعددة

  • الأمن القومي

  • الأقسام الصحية والطبية



  • وسائل التواصل الاجتماعي

  • الجيش

المناطق المذكورة أعلاه هي المستخدمين الرئيسيين لبرنامج Hadoop. الآن، الأمان هي القفزة الرئيسية التي يحتاج Hadoop إلى اتخاذها.

ما هو Hadoop Security؟

Hadoop الأمن يتم تعريفه بشكل عام على أنه إجراء ل آمن وحدة تخزين بيانات Hadoop ، من خلال توفير جدار أمان غير قابل للاختراق تقريبًا ضد أي تهديد إلكتروني محتمل. يصل Hadoop إلى هذا الجدار الأمني ​​عالي الجودة باتباع ما يلي بروتوكول الأمان.

المصادقة

المصادقة هي المرحلة الأولى حيث يتم التحقق من بيانات اعتماد المستخدم. تتضمن أوراق الاعتماد عادةً بيانات الاعتماد المخصصة للمستخدم اسم المستخدم و أ كلمة السر السرية. دخلتسيتم التحقق من بيانات الاعتماد مقابل التفاصيل المتاحة في قاعدة بيانات الأمان. إذا كان صحيحًا ، فسيكون المستخدم مصدق.

تفويض

تفويض هي المرحلة الثانية حيث يقرر النظام ما إذا كان سيوفر الإذن للمستخدم للوصول إلى البيانات أم لا. يعتمد على قائمة التحكم في الوصول المحددة مسبقًا. السريةالمعلومات تبقى آمنة وفقط الموظفين المخولين يمكن الوصول إليه.

تدقيق

تدقيق هي المرحلة الأخيرة ، فهي ببساطة تتعقب العمليات التي قام بها المستخدم المصادق عليه خلال الفترة التي تم فيها تسجيل دخوله إلى المجموعة. هذا هوفقط من أجل الأمان أغراض فقط.

أنواع Hadoop Security

  • أمان Kerberos

كيربيروس هو أحد بروتوكولات مصادقة الشبكة الرائدة المصممة لتوفير خدمات مصادقة قوية لكليهما الخادم و العميل ينتهي عبر المفتاح السري تقنيات التشفير. لقد ثبت أنه آمن للغاية لأنه يستخدم تذاكر الخدمة المشفرة طوال الجلسة بأكملها.

  • تشفير HDFS

تشفير HDFS هو تقدم هائل احتضنته Hadoop على الإطلاق. هنا ، البيانات من مصدر إلى الوجهة (HDFS) يتم تشفيره بالكامل. لا يتطلب هذا الإجراء إجراء أي تغييرات على تطبيق Hadoop الأصلي ، مما يؤدي إلى إجراء عميل ليكون الموظف الوحيد المصرح له التمكن من البيانات.

  • تشفير حركة المرور

تشفير حركة المرور ليس سوى HTTPS (بروتوكول نقل النص التشعبي آمن). يستخدم هذا الإجراء لتأمين نقل البيانات ، من الموقع طالما نقل البيانات إلى الموقع . تستخدم الكثير من بوابات الخدمات المصرفية عبر الإنترنت هذه الطريقة لتأمين المعاملات عبر أ شهادة الأمن

أذونات دليل ملف HDFS العمل بشكل بسيط بوسيكس شكل. ال اقرأ و أكتب يتم توفير الأذونات كـ ص و س على التوالي. أذونات مستخدم ممتاز و عميل يتم تعيينها بشكل مختلف بناءً على سرية الملف.

كيربيروس

كيربيروس هي واحدة من أبسط الشبكات وأكثرها أمانًا بروتوكول المصادقة يستخدمه Hadoop لأمن البيانات والشبكات. اخترعها مع. الهدف الرئيسي من Kerberos هو التخلص من الحاجة إلى تبادل كلمات المرور عبر الشبكة ، وكذلك لتأمين الشبكة من أي احتمال استنشاق الإنترنت.

لفهم مصطلحات Kerberos ، نحتاج أولاً إلى التعرف على المكونات المضمنة في برنامج Kerberos.

KDC أو Key Distribution Center هو قلب Kerberos. يتكون بشكل أساسي من ثلاثة مكونات. يسمى:

  • قاعدة البيانات

ال قاعدة البيانات يخزن بيانات اعتماد المستخدم مثل اسم المستخدم وما يخصها كلمات السر. يقوم أيضًا بتخزين ملفات الوصول إلى الامتيازات الصحيحة المقدمة للمستخدم. تخزن وحدة Kerberos KDC أيضًا معلومات إضافية مثل مفتاح التشفير ، صلاحية التذكرة إلخ

  • خادم المصادقة

سيتم التحقق من بيانات اعتماد المستخدم التي تم إدخالها. إذا كان صحيحًا ، فإن خادم المصادقة سيوفر TGT أو تذكرة توليد التذكرة. يمكن إنشاء TGT فقط إذا قام المستخدم بالدخول أوراق اعتماد صالحة.

  • خادم منح التذكرة

المرحلة التالية هي TGS أو خادم منح التذكرة. إنه في الأساس خادم تطبيق خاص بـ KDC والذي سيوفر لك ملف تذكرة الخدمة. يطلب المستخدم تذكرة الخدمة للتفاعل مع Hadoop والحصول على الخدمة التي يحتاجها أو لإجراء عملية على Hadoop.

يمكنك تثبيت Kerberos عن طريق الأمر التالي:

sudo apt-get install krb5-kdc krb5-admin-server

الآن ، لنفترض أنك ترغب في الوصول إلى مجموعة Hadoop Cluster المؤمنة من Kerberos. تحتاج إلى المرور بالمراحل التالية للوصول إلى مجموعة Hadoop كما هو موضح في الخطوات أدناه:

  • تحتاج إلى الحصول على المصادقة من مجموعة Hadoop. يمكنك الحصول على المصادقة بالتنفيذ كينيت الأمر على Hadoop Cluster.

kinit root / admin
  • ال كينيت سيعيد تنفيذ الأمر توجيهك إلى ملف بيانات اعتماد تسجيل الدخول الصفحة التي من المتوقع أن تدخل فيها اسم المستخدم و كلمه السر.

  • ال كينيت سيرسل طلب المصادقة الى خادم المصادقة.

  • إذا كانت أوراق الاعتماد الخاصة بك صالح، ثم يستجيب خادم المصادقة بـ تذكرة إنشاء التذكرة (TGT).

  • ال كينيت سيخزن ملف TGT في أوراق اعتمادك مخبأ ذاكرة. سيساعدك الأمر التالي على قراءة بيانات الاعتماد الخاصة بك

klist
  • الآن ، تم اعتمادك بنجاح في ملف KDS.

  • قبل الوصول إلى مجموعة Hadoop ، تحتاج إلى إعداد عملاء Kerberos. للقيام بذلك ، استخدم الأمر التالي.

sudo apt-get install krb5-user libpam-krb5 libpam-ccreds auth-client-config
  • الآن ، تحاول تنفيذ ملف قيادة Hadoop. هذا هو عميل Hadoop.

  • ال عميل Hadoop سوف تستخدم الخاص بك TGT وطلبات TGS للموافقة.

  • ال TGS سيوافق على الطلب وسيزودك بامتداد تذكرة الخدمة.

  • هذه تذكرة الخدمة سيتم تخزينه مؤقتًا بواسطة عميل Hadoop.

    تخصيص الذاكرة الديناميكي في c ++ مع برنامج المثال
  • هذه تذكرة الخدمة سيتم استخدامه بواسطة عميل Hadoop لـ نقل مع Hadoop Namenode.

  • ال نامينود سوف تتعرف على نفسها مع تذكرة.

  • كلا ال تذكرة Namenode وعميل Hadoop تذاكر الخدمة سيتم فحصها من قبل بعضها البعض.

  • كلاهما متأكد من أنهما يتواصلان مع كيان مصدق.

  • هذا يسمي المصادقة المتبادلة.

  • المرحلة التالية هي تفويض. سيوفر لك Namenode ملف الخدمات التي حصلت على تفويض.

  • أخيرًا ، المرحلة الأخيرة هي تدقيق. هنا الخاص بك نشاط سوف يكون تسجيل إلى عن على أغراض أمنية.

بهذا نصل إلى نهاية هذا المقال . آمل أن أكون قد ألقيت بعض الضوء على معرفتك على Hadoop الأمن.

الآن بعد أن فهمت Hadoop وأمنه ، تحقق من من Edureka ، وهي شركة تعليمية موثوقة عبر الإنترنت مع شبكة تضم أكثر من 250000 متعلم راضٍ منتشرين في جميع أنحاء العالم. تساعد الدورة التدريبية لشهادة Edureka Big Data Hadoop المتعلمين على أن يصبحوا خبراء في HDFS ، والغزل ، MapReduce و Pig و Hive و HBase و Oozie و Flume و Sqoop باستخدام حالات الاستخدام في الوقت الفعلي في مجال البيع بالتجزئة والوسائط الاجتماعية والطيران والسياحة والمالية

إذا كان لديك أي استفسار يتعلق بهذا 'Hadoop Security' مقال ، فيرجى مراسلتنا في قسم التعليقات أدناه وسنرد عليك في أقرب وقت ممكن.