ما هو التحيز والتباين في التعلم الآلي؟



تتناول هذه المقالة مفهوم التحيز والتباين في التعلم الآلي مع وجود علاقة بينهما تحدد الدقة التنبؤية للنموذج.

في ، فإن أداء النموذج يعتمد على توقعاته ومدى تعميمه تجاه البيانات المستقلة غير المرئية. تتمثل إحدى طرق قياس دقة النموذج في مراعاة التحيز والتباين في النموذج. في هذه المقالة ، سوف نتعلم كيف يلعب التباين المتحيز دورًا مهمًا في تحديد مصداقية النموذج. تتم مناقشة المواضيع التالية في هذه المقالة:

خطأ غير قابل للاختزال

أي نموذج في يتم تقييمه بناءً على خطأ التنبؤ على مجموعة بيانات جديدة ومستقلة وغير مرئية. الخطأ ليس سوى الفرق بين المخرجات الفعلية والمخرجات المتوقعة. لحساب الخطأ ، نقوم بجمع الخطأ القابل للاختزال وغير القابل للاختزال ويعرف أيضًا باسم تحلل التحيز والتباين.





الخطأ الذي لا رجعة فيه ليس سوى تلك الأخطاء التي لا يمكن تقليلها بغض النظر عن أي منها التي تستخدمها في النموذج. إنه ناتج عن متغيرات غير عادية لها تأثير مباشر على متغير الإخراج. لذلك من أجل جعل نموذجك فعالاً ، نترك الخطأ القابل للاختزال الذي نحتاج إلى تحسينه بأي ثمن.

وظيفة التحميل الزائد في مثال c ++

يتكون الخطأ القابل للاختزال من مكونين - التحيز والتباين ، يؤثر وجود التحيز والتباين على دقة النموذج بعدة طرق مثل overfitting ، underfitting ، إلخ.دعونا نلقي نظرة على التحيز والتباين لفهم كيفية التعامل مع الخطأ القابل للاختزال في .



ما هو التحيز في التعلم الآلي؟

التحيز هو في الأساس إلى أي مدى توقعنا القيمة من القيمة الفعلية. نقول إن التحيز مرتفع للغاية إذا كانت التوقعات المتوسطة بعيدة عن القيم الفعلية.

سيؤدي التحيز المرتفع إلى فقدان الخوارزمية للنمط السائد أو العلاقة بين متغيرات الإدخال والإخراج. عندما يكون التحيز مرتفعًا جدًا ، يُفترض أن النموذج بسيط جدًا ولا يفهم مدى تعقيد مجموعة البيانات لتحديد العلاقة وبالتالي ،مما تسبب في عدم ملاءمة.

الفرق في نموذج التعلم الآلي؟

على مجموعة بيانات مستقلة أو غير مرئية أو مجموعة تحقق. عندما لا يعمل النموذج جيدًا كما هو الحال مع مجموعة البيانات المدربة ، فهناك احتمال أن يكون للنموذج تباين. يخبرنا بشكل أساسي كيف تشتت القيم المتوقعة من القيم الفعلية.



يعني التباين الكبير في مجموعة البيانات أن النموذج قد تدرب على الكثير من الضوضاء والبيانات غير ذات الصلة. وبالتالي تسبب في فرط في النموذج. عندما يكون للنموذج تباين كبير ، فإنه يصبح مرنًا للغاية ويقدم تنبؤات خاطئة لنقاط البيانات الجديدة. لأنه قد ضبط نفسه على نقاط البيانات الخاصة بمجموعة التدريب.

دعونا نحاول أيضًا فهم مفهوم التباين المتحيز رياضيًا. دع المتغير الذي نتوقع أن يكون Y والمتغيرات المستقلة الأخرى هي X. الآن دعونا نفترض أن هناك علاقة بين المتغيرين مثل:

ص = و (س) + ه

في المعادلة أعلاه ، هنا يكون هو الخطأ المقدّر بمتوسط ​​قيمة 0. عندما نصنع مصنفًا باستخدام خوارزميات مثل الانحدارالخطي ، ، وما إلى ذلك ، سيكون الخطأ التربيعي المتوقع عند النقطة x هو:

يخطئ (س) = الانحياز2+ تباين + خطأ غير قابل للاختزال

دعونا نفهم أيضًا كيف سيؤثر تباين التحيز على ملف التعلم الالي أداء النموذج.

ماذا يفعل العازلة في جافا

كيف تؤثر على نموذج التعلم الآلي؟

يمكننا وضع العلاقة بين تباين التحيز في أربع فئات مدرجة أدناه:

  1. تباين مرتفع - انحياز مرتفع - النموذج غير متسق وغير دقيق أيضًا في المتوسط
  2. انخفاض التباين - التحيز المرتفع - النماذج متسقة ولكنها منخفضة في المتوسط
  3. تباين مرتفع - انحياز منخفض - دقيق إلى حد ما ولكنه غير متسق مع المتوسطات
  4. تباين منخفض - انحياز منخفض - إنه السيناريو المثالي ، النموذج ثابت ودقيق في المتوسط.

التباين التحيز في التعلم الآلي- edureka

على الرغم من أن الكشف عن التحيز والتباين في النموذج واضح تمامًا. النموذج ذو التباين العالي سيكون به خطأ تدريب منخفض وخطأ كبير في التحقق من الصحة. وفي حالة التحيز العالي ، سيكون للنموذج خطأ تدريب مرتفع وخطأ التحقق من الصحة هو نفس خطأ التدريب.

بينما يبدو الكشف سهلاً ، فإن المهمة الحقيقية هي تقليله إلى الحد الأدنى. في هذه الحالة ، يمكننا القيام بما يلي:

  • أضف المزيد من ميزات الإدخال
  • مزيد من التعقيد عن طريق إدخال ميزات كثيرة الحدود
  • تقليل مدة التسوية
  • الحصول على المزيد من بيانات التدريب

الآن بعد أن عرفنا ما هو التحيز والتباين وكيف يؤثران على نموذجنا ، دعونا نلقي نظرة على مقايضة التباين التحيز.

مقايضة التباين والتحيز

يسمى إيجاد التوازن الصحيح بين الانحياز والتباين في النموذج بمقايضة التحيز-التباين. إنها في الأساس طريقة للتأكد من أن النموذج ليس أكثر من اللازم أو غير مناسب في أي حال.

إذا كان النموذج بسيطًا جدًا ويحتوي على عدد قليل جدًا من المعلمات ، فسوف يعاني من انحياز كبير وتباين منخفض. من ناحية أخرى ، إذا كان النموذج يحتوي على عدد كبير من المعلمات ، فسيكون له تباين كبير وانحياز منخفض. يجب أن تؤدي هذه المقايضة إلى علاقة متوازنة تمامًا بين الاثنين. من الناحية المثالية ، يكون التحيز المنخفض والتباين المنخفض هو الهدف لأي نموذج من نماذج التعلم الآلي.

إجمالي الخطأ

في أي نموذج من نماذج التعلم الآلي ، يعمل التوازن الجيد بين التحيز والتباين كسيناريو مثالي من حيث الدقة التنبؤية وتجنب الإفراط في التجهيز ، وعدم الملائمة تمامًا. سيضمن التوازن الأمثل بين التحيز والتباين ، من حيث تعقيد الخوارزمية ، عدم تجهيز النموذج أو عدم تركيبه على الإطلاق.

يعتبر متوسط ​​الخطأ التربيعي في النموذج الإحصائي بمثابة مجموع مربع الانحياز والتباين والتباين في الخطأ. يمكن وضع كل هذا في خطأ كلي حيث يكون لدينا تحيز وتباين وخطأ غير قابل للاختزال في النموذج.

دعونا نفهم كيف يمكننا تقليل الخطأ الكلي بمساعدة التطبيق العملي.

لقد أنشأنا ملف مصنف الانحدار الخطي في ال الانحدار الخطي في التعلم الآلي مقالة عن Edureka باستخدام مجموعة بيانات مرض السكري في وحدة مجموعات البيانات الخاصة بـ تعلم scikit مكتبة.

عندما قمنا بتقييم متوسط ​​الخطأ التربيعي للمصنف ، حصلنا على خطأ إجمالي حوالي 2500.

لتقليل الخطأ الكلي ، قمنا بتغذية المزيد من البيانات إلى المصنف وفي المقابل تم تقليل الخطأ التربيعي المتوسط ​​إلى 2000.

pivot and unpivot في خادم SQL

إنه تنفيذ بسيط لتقليل الخطأ الكلي عن طريق تغذية المزيد من بيانات التدريب إلى النموذج. وبالمثل ، يمكننا تطبيق تقنيات أخرى لتقليل الخطأ والحفاظ على التوازن بين التحيز والتباين من أجل نموذج فعال للتعلم الآلي.

يقودنا هذا إلى نهاية هذه المقالة حيث تعلمنا التحيز-التباين في ماخine Learning مع حالة التنفيذ والاستخدام. آمل أن تكون واضحًا بشأن كل ما تمت مشاركته معك في هذا البرنامج التعليمي.

إذا وجدت هذه المقالة حول 'التحيز-التباين في التعلم الآلي' ذات صلة ، فراجع ملف شركة تعليمية موثوقة عبر الإنترنت مع شبكة تضم أكثر من 250000 متعلم راضٍ منتشرة في جميع أنحاء العالم.

نحن هنا لمساعدتك في كل خطوة في رحلتك والتوصل إلى منهج مصمم للطلاب والمهنيين الذين يريدون أن يكونوا . تم تصميم الدورة التدريبية لمنحك بداية قوية في برمجة Python وتدريبك على مفاهيم Python الأساسية والمتقدمة جنبًا إلى جنب مع العديد مثل ، ، إلخ.

إذا صادفت أي أسئلة ، فلا تتردد في طرح جميع أسئلتك في قسم التعليقات في 'التحيز-التباين في التعلم الآلي' وسيسعد فريقنا بالإجابة.