أسئلة مقابلة علوم البيانات في Google: كل ما تحتاج إلى معرفته لحل المشكلة



توفر لك هذه المقالة مجموعة من Google Data Science مقابلة Questiosn وعملية المقابلة والمتطلبات الأساسية للتقدم لوظيفة في Google.

يعد الحصول على وظيفة في شركة مشهورة عالميًا مثل Google وظيفة أحلام لكثير من الناس. لديهم بعض من أكثر علماء أبحاث الذكاء الاصطناعي موهبة ، و في العالم. لا توجد مصادر عديدة لـ Google أسئلة المقابلة عبر الإنترنت وليس من السهل الحصول على وظيفة هناك. لذلك ، سأغطي الموضوعات التالية في هذه المقالة:

الوصف الوظيفي والمتطلبات

بمتوسط ​​راتب 169.067 دولارًا ، بما في ذلك المكافأة. يتراوح راتب عالم البيانات في Google بين 120000 دولار - 280 ألف دولار . مع هذا الراتب المرتفع ، تحتاج إلى معرفة المتطلبات الصحيحة للوظيفة التي تتقدم إليها. على الرغم من أن المتطلبات تختلف من موقع إلى آخر ، فيما يلي بعض المتطلبات الشائعة:

الحد الأدنى من المتطلبات:





google

  • درجة الماجستير في الانضباط الكمي (الإحصاء ، وبحوث العمليات ، وعلوم الكمبيوتر)
  • 2 سنوات من الخبرة في العمل في مجال تحليل البيانات ذات الصلة
  • خبرة مع البرامج الإحصائية (على سبيل المثال ، ر و و MATLAB و Pandas) و
  • تجربة مع لغات قاعدة البيانات (على سبيل المثال ، SQL )

المسؤوليات:



كيفية استخدام aws cli
  • العمل مع مجموعات البيانات الكبيرة والمعقدة. حل مشاكل التحليل الصعبة وغير الروتينية ، وتطبيق الأساليب التحليلية المتقدمة حسب الحاجة
  • إجراء التحليل الذي يشمل جمع البيانات ومواصفات المتطلبات والمعالجة والتحليل والتسليمات المستمرة والعروض التقديمية
  • إنشاء خطوط أنابيب تحليل ونماذجها الأولية بشكل متكرر لتوفير رؤى على نطاق واسع
  • تطوير معرفة شاملة بهياكل ومقاييس بيانات Google ، والدعوة للتغييرات عند الحاجة لتطوير المنتج
  • التفاعل عبر الوظائف ، وتقديم توصيات الأعمال (على سبيل المثال ، التكلفة والفائدة ، والتنبؤ ، وتحليل التجربة)
  • البحث عن طرق التحليل والتنبؤ والتحسين وتطويرها لتحسين جودة منتجات Google التي تواجه المستخدم

عملية مقابلة علوم البيانات في Google

مسح القائمة المختصرة هو في حد ذاته مهمة صعبة ، والتي تعتمد كليًا على عملك السيرة الذاتية ، خطاب المقدمة و ال تجربة . جوجل علم البيانات أسئلة المقابلة هي مزيج من ألعاب التفكير والاستفسارات الفنية. عادة ، تكون العملية الأولى هي المقابلة الهاتفية.

مقابلة هاتفية:

يتكون من أسئلة تستند في الغالب إلى (ملموس ونظري) ويعتمد بشكل كبير على . تختلف الأسئلة أيضًا بناءً على المشاريع التي عملت عليها.
  • حالة 1: استفسرت المقابلات عن تقنيات استخراج الميزات ، PCA (المستخدمة في المشاريع) ، تحليل الارتباط ، بعض تقنيات التصنيف التي تم استخدامها (SVM ، GBM ، الشبكة العصبية). لماذا لا يكون الانحدار اللوجستي ، ولماذا GBM؟ - أسئلة تدور حول إمكانية الفصل بين الفئات.
  • الحالة 2: لماذا استخدام اختيار الميزة؟ إذا كان هناك متنبئان مرتبطان ارتباطًا وثيقًا ، فما هو التأثير على المعاملات في الانحدار اللوجستي؟ ما هي فترات الثقة للمعاملات؟
  • الحالة 3: قرص يدور على مغزل ولا تعرف الاتجاه الذي يدور به القرص. يتم تزويدك بمجموعة من الدبابيس. كيف ستستخدم الدبابيس لوصف الطريقة التي يدور بها القرص؟
بعد المقابلات الهاتفية ، أصبحت جولات وجهاً لوجه والترميز. لذلك ، دعونا نناقش بعض أسئلة المقابلة حول علوم البيانات الأكثر شيوعًا في Google. على الرغم من أنه قد لا يتم طرح هذه الأسئلة تمامًا كما هو موضح أدناه ، فقد حاولت تغطية الكثير منها.

أسئلة مقابلة علوم البيانات في Google

هذه الأسئلة ليست ألغازًا ، حيث توقف Google عن طرح هذه الأسئلة بدلاً من ذلك ، لديهم أسئلة مماثلة يسمونها أسئلة حل المشكلات . يتم طرح الكثير من أسئلة التعلم الآلي ، بدءًا من الأسئلة العامة إلى العملية. جوجل يغطي أساسًا اتساع نطاق الموضوعات بدلاً من العمق. س 1. أنت في كازينو ولديك نردتان للعب بهما. تربح 10 دولارات في كل مرة تقوم فيها برمي 5. إذا لعبت حتى تفوز ثم توقفت ، فما هو العائد المتوقع؟ س 2. أنت على وشك ركوب طائرة إلى لندن ، وتريد أن تعرف ما إذا كان عليك إحضار مظلة أم لا. تتصل بثلاثة من أصدقائك العشوائيين وكل واحد منهم إذا كانت السماء تمطر. احتمال أن صديقك يقول الحقيقة هو 2/3 واحتمال أنه يلعب مقلبًا عليك من خلال الكذب هو 1/3. إذا أخبر الثلاثة منهم أنها تمطر ، فما هو احتمال أن تمطر بالفعل في لندن. Q3. كيف تضيف الجديد موقع التواصل الاجتماعي الفيسبوك أعضاء في قاعدة بيانات الأعضاء ، وترميز علاقاتهم بالآخرين في قاعدة البيانات؟ س 4. كيف ستختبر أن هناك احتمالًا متزايدًا لبقاء المستخدم نشطًا بعد 6 أشهر بالنظر إلى أن المستخدم لديه أصدقاء أكثر الآن؟ س 5. يتم منحك 40 بطاقة بأربعة ألوان مختلفة - 10 بطاقات خضراء و 10 بطاقات حمراء و 10 بطاقات زرقاء و 10 بطاقات صفراء. بطاقات كل لون مرقمة من واحد إلى عشرة. يتم اختيار بطاقتين عشوائيًا. اكتشف احتمال أن البطاقات المختارة ليست من نفس الرقم ونفس اللون. س 6. أنشئ برنامجًا بلغة من اختيارك لقراءة ملف نصي به تغريدات متنوعة. يجب أن يكون الناتج ملفين نصيين - أحدهما يحتوي على قائمة بجميع الكلمات الفريدة بين جميع التغريدات مع عدد الكلمات المكررة والملف الثاني يجب أن يحتوي على متوسط ​​عدد الكلمات الفريدة لجميع التغريدات. Q7. ماذا ستفعل إذا تسببت إزالة القيم المفقودة من مجموعة البيانات في حدوث انحياز؟ س 8. قرص يدور على مغزل ولا تعرف الاتجاه الذي يدور به القرص. يتم تزويدك بمجموعة من الدبابيس. كيف ستستخدم الدبابيس لوصف الطريقة التي يدور بها القرص؟ س 9. كيف ستصمم محرك توصية للوظائف؟ س 10. ما نوع المنتج الذي تريد إنشاءه في Google؟ س 11. يتم زرع السيارات بمتعقب السرعة حتى تتمكن شركات التأمين من تتبع حالة القيادة لدينا. بناءً على هذا المخطط الجديد ، ما نوع الأسئلة التجارية التي يمكن الإجابة عليها؟ Q12. كيف يمكنك أن تقرر ما إذا كانت إحدى الخوارزميات أفضل من الأخرى؟ Q13. صندوق به 12 بطاقة حمراء و 12 بطاقة سوداء. صندوق آخر به 24 بطاقة حمراء و 24 بطاقة سوداء. تريد سحب ورقتين عشوائيًا من أحد الصندوقين ، أيهما لديه احتمال أكبر للحصول على بطاقات من نفس اللون ولماذا؟ س 14. ما هو الفرق بين النموذج المعبأ والموديل المعزز؟ س 15. أنت تقوم بإنشاء تقرير لعمليات تحميل محتوى المستخدم كل شهر وتلاحظ زيادة مفاجئة في عدد التحميلات لشهر يناير. الزيادة في التحميلات خاصة في عمليات تحميل الصور. ما هو السبب في ذلك برأيك وكيف ستختبر هذا الارتفاع المفاجئ؟ س 16. أنت تمتلك مؤسسة ملابس وترغب في تحسين مكانك في السوق. كيف ستفعل ذلك من مستوى الأرض؟ Q17. كيف ستقرر أي إصدارين من خوارزميات تسعير الطفرة يعمل بشكل أفضل لأي شركة طيران؟ س 18. ما هي درجة الحرية لاسو؟ س 19. ما هو الفرق بين المكرر والمولد وفهم القائمة في بايثون؟ س 20. بالنظر إلى مجموعة من صفحات الويب والتغييرات على موقع الويب ، كيف ستختبر ميزة موقع الويب الجديدة لتحديد ما إذا كان التغيير يعمل بشكل إيجابي؟ س 21. بالنظر إلى مصفوفة أبعاد MxN مع كل خلية تحتوي على أبجدية ، ابحث عما إذا كانت هناك سلسلة مضمنة فيها أم لا. Q22. كيف ستنشئ نظام تخزين مؤقت باستخدام بنية بيانات متقدمة مثل hashmap؟ Q23. إذا كان بإمكانك الحصول على مجموعة بيانات حول أي موضوع يهمك ، بغض النظر عن طرق أو موارد التجميع ، فكيف ستبدو مجموعة البيانات وماذا ستفعل بها؟ س 24. ما هي طرق الكشف عن الشذوذ؟ Q25. كيف يعمل التخزين المؤقت وكيف تستخدمه في علم البيانات؟ إذن يا رفاق ، بهذا ننتهي من هذه المقالة. أسئلة مقابلة Google Data Science هي في الغالب على أساس السيناريو وتتطلب لديك قدرات حل المشكلات وعلاوة على ذلك تحتاج إلى معرفة كيفية تطبيق Data Science على هذه المواقف. آمل أن يمنحك هذا منظورًا لتكون مستعدًا لأي مقابلة في علوم البيانات في المستقبل. سواء كانت Google أو Microsoft أو Apple أو Uber. يطرح جميع عمالقة التكنولوجيا أنواعًا متشابهة من الأسئلة عندما يتعلق الأمر بعلم البيانات لأنه مجال شاسع وفي نفس الوقت مجال جديد. يجعلك بارعًا في الأدوات والأنظمة التي يستخدمها متخصصو علوم البيانات. ويشمل التدريب على الإحصاء وعلوم البيانات و Python و Apache Spark & ​​Scala و Tensorflow و Tableau. تم تحديد المنهج من خلال بحث مكثف حول أكثر من 5000 وصف وظيفي في جميع أنحاء العالم. إذا كان لديك أي استفسارات ، فلا تتردد في ذكرها في قسم التعليقات أدناه.