Post Top Ad

Your Ad Spot

السبت، 26 يناير 2019

Regression Tutorial






دلوقتي انا عملت الBlog دي عشان احط فيها اعلانات وعلشان اكون صريح معاكم .. المهم بقالي بتاع 3 او 4 شهور بجهز فيها وكل حاجة تمام وكل حاجة فل الفل وجهزت مبلغ محترم كداه عشان ال Personal Branding بتاعي أسمه يبقي في السمي والناس تقول الدكتور راح والدكتور جاه .. بس بعد 3 شهور من تشغيل الBlog والمنشورات الي بنشرها والشروحات والكورسات وغيره الاقيلك اني مش عارف احدد العلاقة بين الفلوس الي بدفعها في ال Marketing وGoogle ads revenue بتاعتي !
طب انا عالم بيانات والمفروض اني متمكن يعني من مجالي الي حد يخليني أعرف احل مشكلة كبيرة زي دي مش صح !

بدأت اسأل نفسي سؤال طب ايه الي بيعتمد علي التاني ؟
اكيد ال Revenue بتعتمد علي ال Marketing يعني انا ممكن أقول علي ال Marketing انه X او (ID) وأقول علي ال Revenue انه (D) برضو صح لأن التاني بيعتمد علي الاولاني .

المهم قريت شوية لقيت ان في حاجة اسمها Regression ودا فيما معناه ان احنا هنربط المتغيرات المستقلة بالمتغيرات الغير مستقلة علشان نوجد علاقة من خلالها أقدر اتنبأ بالمتغيرات الغير مستقلة المرتبطة بالمتغيرات المستقلة .. طبعا كلام غريب جدا تعالا أبسطهالك يا عزيزي عالم البيانات :


هنفترض ان ال Y بتاعتي هي عبارة عن ال Revenue وال X1  هي الحاجا الي لو اتغيرت هتأثر في ال Y بتاعتي , طبعا التأثير مش هيكون بنفس النسبة ومش هيكون في نفس الاتجاه عشان كداه في حاجة اسمها B1-B0 وهي دي تعتبر اللعب كله فيها لأنها هتتحكم في ناتج المعادلة النهائي وهتكون ثابتة فيما بعد مهما كانت المتغيرات متغيرة ... توهت مني صح ؟

بكل بساطة انتا كنت بتعوض بقيم (س,ص) علشان تجيب نواتج معادلة موجوة أصلا وكنت بتعيط وانتا في ثانوي , ال Model هياخد منك النواتج(DataSet) وهيعتمد علي نفسه لحد مايجيب هو بنفسه المعادلة دي وبعدين تستخدمها انتا في انك تجيب حلول للدالة الي هو لسة لاقيها في انك تتنبأ بقيم مكنتش موجودة قبل كدا ( تنبأ بالمستقبل علي صغير كدا ) !

ازاي Model هيجيب المعادلة دي بنفسه يا تري ؟
زي ما انتا شايف كداه هو بيفضل يتحرك يتحرك يتحرك لحد ما يلاقي الخط الي بيحلم بيه الخط دا الي بيكون بيضرب اكبر عدد من النقط وطالما بيضرب اكبر عدد من النقط يبقي الError بتاعه قليل جدا ليه ؟ لأنه طالما لامس كل النقاط ودا مستحيل طبعا فا دا معناه ان ال Prediction بتاعك هيكون قوي وعملي جدا وتقدر تعتمد عليه والنسبة هتكون فوق ال 90%  

اما بالنسبة للخط الي بيحلم بيه ال Model فا داه بيكون أسمه Best Fit Line وهو بيكون عبارة عن أقل فرق تربيعي بين ال y hat(Prediction) - y أول ما بيلاقي ال
 best-fit Line بيجري عليه وبياخده بالحضن ويبدأ يحسب الError بتاعه وبالمناسبة الError بيكون علاقته عكسية مع نسبة الAccurcy بتاعت ال Model 


انا لو شرحت أكتر من كداه يبقي ضيعت عليك المتعة الي هحاول اني اضيفها في الشرح بتاعي وعلشان كداه انا سايبلك لينك بالمصادر فيها شرح تفصيلي عن العملية دي بكل تفاصيلها ولينك كمان للتطبيق العملي علي الكورس داه هطبق عليه 10 مشاريع كاملين باذن الله شارك في التعليقات التعريف النموذجي لل Regression وللعلم دا أول سؤال في
 Data Scientist Interview وبالتوفيق

برجاء القاء نظرة سريعة :





Vocab :

Non-Linear
Linear
Regression
Prediction
Accuracy
Regression Model 
Predictive Model
Revenues
Marketing


بالنسبة للمصادر :

ملاحظة : دا يعتبر تلخيص بسيط جدا عن عمق المشروع او ال Paper دي او التقنية دي كعلم كامل فا لا يتم مقارنتها اطلاقا بكمية المعلومات المطروحة ولكنها اقل عدد من المعلومات تقدر تعتمد عليها علشان تقدر تطبق عمليا

هناك تعليقان (2):

Post Top Ad

Your Ad Spot

Datalizer