التقرير يتحدث عن تحليل خدمات المقاهي في السعودية تحديدا لثلاث مدن التي هي: جدة، الرياض والشرقية, وذلك عبر استخراجهم من Google maps. تم انجاز هذا التحليل في ثلاث مراحل أساسية التي تتمثل في استخراج البيانات، تنظيم، تحويل البيانات وعرض مرئي للبيانات:
-
استخراج البيانات:
تم استخراج بيانات المقاهي من information panel لموقع Google Maps باستخدام web scraping بالبايثون.
-
تنظيم وتحويل البيانات:
تم في هذه المرحلة تنظيم البيانات وتنظيفها وتحويلها لتصبح مفهومة أكثر وتعتبر المرحلة الأطول في المشروع بل نستطيع القول اصعبها لان قبل فعل أي شيء يجب فهم البيانات لنتمكن من تنظيمها و تتمثل في التالي:
- Link: رابط المقهى
- Name: اسم المقهى
- Rate: تقييم المقهى (حسب الموقع)
- Reviews: عدد المقيمين
- Price_level: هي عبارة عن رمز $ وترمز كالاتي:
$: inexpensive
$$: moderate
$$$: expensive
$$$$: very expensive
Type .6 : نوع المحل غالبا coffee shop
Adders .7: عنوان المقهى
- About: معلومات حول المقهى
- Time: توقيت غلق المقهى
- Image: صورة
- Dine in: الأكل داخل المقهى، خارج المقهى..
- Takeaway: خدمة طعام سفري
- Delivery: انواع خدمة التسليم بعد فهم وتنظيم البيانات يجب تحويل البيانات لكي تصبح أكثر وضوحا ولهذا قمنا ب:
- إضافة عمود region الذي يحمل اسم المدينة.
- اضافة عمود PL حيث قمنا بالتحويل الرموز ال price_leve الى معانيها.
- إضافة عمود R الذي هو ضرب (rate * reviews) لترتيب التقييمات لان مثلا صاحب 4,5 ب 1000 تصويت أقل من 4,5 ب 2000 صوت.
- اضافة عمودين Lat و Long وهما عبارة عن احداثيات المقاهي وقمنا استخراجهم بالبايثون التي هي لغة برمجة تستعمل كثيرا في تحليل البيانات والذكاء الاصطناعي وذلك باستعمال library re لاستخراج latitude و longitude من روابط (link) المقاهي.
-
عرض مرئي للبيانات:
هنا المرحلة الاخيرة من العمل وهي تحويل البيانات إلى صور عن طريق power bi، هو برنامج يستعمل لتحليل، عرض صور مرئية ومشاركة المشاريع وهو مقسم الى 4 اجزاء:
- Data sources
- ETL (Extract, Transform, Load)
- Data warehouse
- Reporting
-
تحليل البيانات:
تم تحليل الصور وصفيا وعمل نموذج Naive Bayes لتنبؤ بالمقهى الأغلى جغرافيا. ونستعرض فقط هنا النتائج النهائية.
-
خدمة Dine In:

هنا نلاحظ ان هناك اكثر من 53% من المقاهي (جدة، رياض، الشرقية) توفر الأكل داخل المقهى و 36,62% لم يضعوا أي خدمة في الموقع وهناك 7,02% تسوق داخل المتجر كما 2,52% أكل خارج المتجر و في الاخير 0,11% ايصال إلى السيارة.
2. خدمات Delivery:

الصورة توضح ان 58,77% توفر خدمة التوصيل بدون تلامس كما هناك 31,36% لم تذكر الخدمة و 7,24% لا توفر خدمة التوصيل و 2,63% توصيل.
3. Rate of coffee shops:

المخطط البياني شريطي يبين لنا توقيت غلق المقاهي و تبين لنا ان اغلب المقاهي تغرق بين 10 مساءا إلى 3 صباحا.
4. Rate of coffee shops:

نلاحظ في المنحنى المستويات الاسعار التي اغلبها moderate و ان تقريبا نصف المقاهي لم يحدد مستوى اسعارهم.
5. Price level map:
الان راح ننتقل الى تحليل مواقع المقاهي و توزعهم في المدن و ذلك باستعمال خريطة التي تأخذ احداثيات المقاهي كالاتي:

الخرائط تبين لنا توزع مستويات الأسعار في المدن الثلاثة بحيث تتمركز الاسعار المرتفعة جدا في وسط المدينتين جدة (اقرب الى البحر) وفي الرياض ( شمال الرياض) في المقابل منطقة الشرقية لا يوجد بها مقاهي بأسعار مرتفعة جدا مع وجود عدد قليل تعتبر أسعارها مرتفعة لكن أغلبها متوسطة أو غير مرتفعة.
6. خريطة Dine in location :

هنا خريطة تبين لنا خدمات الأكل التي توفرها المقاهي حسب المدن، حيث الخدمة الأكثر المتوفرة هي خدمة الأكل داخل المتجر.
7. خريطة Delivery :

في الخريطة التوصيل نرى أن التسليم بدون تلامس هي الخدمة التي توفرها أغلب المقاهي على مستوى كل المدن (و هذا راجع لأسباب وقائية ضد جائحة كورونا).
8. خريطة التقييم :

سيحدث هذا العمل لاحقا بإضافة نموذج بايز.