تقنيات النمذجة في تحليلات الأعمال مع R



تقدم المدونة مقدمة موجزة عن تقنيات النمذجة في تحليلات الأعمال مع R.

تقنيات النمذجة المختلفة:

يمكننا تقسيم أي مشكلة إلى عمليات أصغر:





تصنيف - حيث نصنف البيانات. على سبيل المثال جميع الأمراض تظهر سلوكًا معينًا ، ويمكننا تصنيفها بشكل أكبر.

على سبيل المثال: أمراض تقلل المناعة ، أمراض تسبب الصداع ، إلخ.



تراجع - يتضمن اكتشاف العلاقة بين المتغيرات المتعددة.

على سبيل المثال: كيف يرتبط وزن الإنسان بطوله.

شذوذكشف - هو في الأساس تقلب.



على سبيل المثال: في حالة الجهد العالي أو الجهد المنخفض.

مثال آخر يمكن أن يشمل السلوك المنظم الذي يتضمن القيادة في الجانب الأيمن أو الجانب الأيسر بناءً على البلد. الشذوذ هنا هو شخص يقود من العكس.

الفرق بين c # و c ++

مثال آخر يمكن أن يكون اختراق الشبكة. هنا ، يسجل مستخدم تمت مصادقته الدخول إلى موقع الويب الخاص بشركتك ، ثم إذا قام شخص غير مصادق بتسجيل الدخول ، فسيكونAn0moly.

أهمية السمة - يعطي في الأساس سمات متعددة ، مثل الطول والوزن ودرجة الحرارة ونبض القلب. هناك نقطة يجب ملاحظتها وهي أن كل هذه السمات مهمة لمهمة ما.

ما هو جافا بيئة تطوير متكاملة

على سبيل المثال: شخص ما يحاول التنبؤ ، في أي وقت سيصل الشخص إلى المكتب. تلعب كل سمة دورًا مهمًا ولكن ليست كل السمات مهمة.

قواعد الرابطة - بعبارات أبسط ، هو تحليل السلوك التالي أو توقعه ، حيث يدور حول محرك التوصية.

على سبيل المثال: يمكن للشخص الذي يشتري الخبز أن يشتري الحليب أيضًا. إذا قمنا بتحليل سلوكيات التسوق السابقة ، فإن كل العناصر الموجودة في السلة لها علاقة. في هذه الحالة ، قد يكون هناك احتمال أن يشتري الشخص الذي يشتري الخبز الحليب أيضًا.

تجمع - وهي من أقدم التقنيات في الإحصاء. في الواقع ، يمكن للمرء دائمًا أن يصمم أي مشكلة ، سواء كان ذلك التصنيف أو التجميع ، مما يعني تجميع كيانات متشابهة.

فمثلا:

1) خذ سلة من التفاح والبرتقال ، حيث يمكننا فصل التفاح عن البرتقال.

2) حالة استخدام مهمة للتكتل هي الرعاية الصحية. بدأت جميع الإحصاءات والتحليلات تقريبًا باستخدام حالات الرعاية الصحية. للتعمق أكثر ، هناك مصطلح تجميعي يسمى مجموعات (الأشخاص المصابون بأمراض مماثلة) ، بحيث يمكن دراستها بشكل منفصل عن العملاء الحاليين. على سبيل المثال ، إذا كان 10 أشخاص يعانون من الحمى و 10 أشخاص آخرين من الصداع ، فسنجد ما هو مشترك بينهم وننتج الدواء.

ميزة استخراج - في دقة استخراج الميزات ، تعتبر الصلاحية والفشل وثيقين تمامًا. بمعنى آخر ، يمكن تسمية استخراج الميزة بالتعرف على الأنماط.

فمثلا:

في بحث Google ، عندما يقوم المستخدم بإدخال مصطلح ، فإنه يأتي بنتائج. الآن ، السؤال المهم الذي يجب طرحه هو كيف عرفت ، ما هي الصفحة ذات الصلة وغير ذات الصلة بالمصطلح؟ يمكن الرد على ذلك باستخراج الميزات والتعرف على الأنماط ، حيث يضيف ميزات بارزة. لنفترض أنه تم تقديم صورة ، وأن بعض الكاميرات تكتشف الوجوه ، وتميز الوجه لإعطاء صور جميلة ، والتي تستخدم أيضًا التعرف على الميزات.

التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف

إلى) فئة التنبؤ - تشمل التقنيات الانحدار والشبكات اللوجستية والشبكات العصبية وأشجار القرار. تتضمن بعض الأمثلة اكتشاف الاحتيال (حيث يتعلم الكمبيوتر ويتنبأ بعملية الاحتيال التالية من تاريخ الاحتيال السابق). في التعلم غير الخاضع للإشراف ، لا يمكن التنبؤ بأمثلة لعدم وجود بيانات تاريخية.

ب) فئة التصنيف - أخذ مثال ، سواء كانت المعاملة احتيالية أم لا ، تدخل في فئة التصنيف. هنا ، نأخذ البيانات التاريخية ونصنفها مع أشجار القرار أو في حالة عدم أخذ أي بيانات تاريخية على الإطلاق ، فإننا نبدأ مباشرة بالبيانات ونحاول استغلال الميزات بمفردنا. على سبيل المثال ، إذا احتجنا إلى معرفة الموظفين ، فمن المرجح أن يغادروا المنظمة أو من المرجح أن يبقوا. في حال كانت مؤسسة جديدة ، حيث لا يمكننا استخدام البيانات التاريخية ، يمكننا دائمًا استخدام المجموعات لاستخراج البيانات.

ج) فئة الاستكشاف - هذه طريقة مباشرة إلى الأمام ، ما تعنيه البيانات الضخمة. في التعلم غير الخاضع للإشراف ، يطلق عليه المكونات الأساسية والتكتل.

د) فئة التقارب - هنا عناصر متعددة متضمنة مثل البيع الإضافي / البيع الإضافي وتحليل سلة السوق. في تحليل السلة ، لا يوجد تعلم خاضع للإشراف حيث لا توجد بيانات تاريخية. لذلك نأخذ البيانات مباشرة ونجد الارتباطات والتسلسل وتحليل العوامل.

ما هو متغير المثيل في جافا

لديك سؤال لنا؟ أذكرها في قسم التعليقات وسنعاود الاتصال بك.

المنشورات ذات الصلة: