غير مصنف1

تحليل بيانات عن مقاهي القهوة

 

التقرير يتحدث عن تحليل خدمات المقاهي في السعودية تحديدا لثلاث مدن التي هي: جدة، الرياض والشرقية, وذلك عبر استخراجهم من Google maps. تم انجاز هذا التحليل في ثلاث مراحل أساسية التي تتمثل في استخراج البيانات، تنظيم، تحويل البيانات وعرض مرئي للبيانات:

 

  • استخراج البيانات:

تم استخراج بيانات المقاهي من information panel لموقع Google Maps باستخدام  web scraping بالبايثون.

  • تنظيم وتحويل البيانات:

تم في هذه المرحلة تنظيم البيانات وتنظيفها وتحويلها لتصبح مفهومة أكثر وتعتبر المرحلة الأطول في المشروع بل نستطيع القول اصعبها لان قبل فعل أي شيء يجب فهم البيانات لنتمكن من تنظيمها و تتمثل في التالي:

  1. Link: رابط المقهى
  2. Name: اسم المقهى
  3. Rate: تقييم المقهى (حسب الموقع)
  4. Reviews: عدد المقيمين
  5. Price_level: هي عبارة عن رمز $ وترمز كالاتي:

$: inexpensive

$$: moderate

$$$: expensive

$$$$: very expensive

Type .6 : نوع المحل غالبا coffee shop

Adders .7: عنوان المقهى

  1. About: معلومات حول المقهى
  2. Time: توقيت غلق المقهى
  3. Image: صورة
  4. Dine in: الأكل داخل المقهى، خارج المقهى..
  5. Takeaway: خدمة طعام سفري
  6. Delivery: انواع خدمة التسليم بعد فهم وتنظيم البيانات يجب تحويل البيانات لكي تصبح أكثر وضوحا ولهذا قمنا ب:
  7. إضافة عمود region الذي يحمل اسم المدينة.
  8. اضافة عمود PL حيث قمنا بالتحويل الرموز ال price_leve الى معانيها.
  9. إضافة عمود R الذي هو ضرب (rate * reviews) لترتيب التقييمات لان مثلا صاحب 4,5 ب 1000 تصويت أقل من 4,5 ب 2000 صوت.
  10. اضافة عمودين Lat و Long وهما عبارة عن احداثيات المقاهي وقمنا استخراجهم بالبايثون التي هي لغة برمجة تستعمل كثيرا في تحليل البيانات والذكاء الاصطناعي وذلك باستعمال library re لاستخراج latitude و longitude من روابط (link) المقاهي.

 

  • عرض مرئي للبيانات:

هنا المرحلة الاخيرة من العمل وهي تحويل البيانات إلى صور عن طريق power bi، هو برنامج يستعمل لتحليل، عرض صور مرئية ومشاركة المشاريع وهو مقسم الى 4 اجزاء:

  • Data sources
  • ETL (Extract, Transform, Load)
  • Data warehouse
  • Reporting

 

  • تحليل البيانات:

تم تحليل الصور وصفيا وعمل نموذج Naive Bayes لتنبؤ بالمقهى الأغلى جغرافيا. ونستعرض فقط هنا النتائج النهائية.

  1.  خدمة Dine In:

 

 

الصورة (1): خدمات الأكل

 هنا نلاحظ ان هناك اكثر من 53% من المقاهي (جدة، رياض، الشرقية) توفر الأكل داخل المقهى و 36,62% لم يضعوا أي خدمة في الموقع وهناك 7,02% تسوق داخل المتجر كما 2,52% أكل خارج المتجر و في الاخير 0,11% ايصال إلى السيارة.

2. خدمات Delivery:

الصورة (2): خدمات التوصيل

الصورة توضح ان 58,77% توفر خدمة التوصيل بدون تلامس كما هناك 31,36% لم تذكر الخدمة و 7,24% لا توفر خدمة التوصيل و 2,63% توصيل.

 

3. Rate of coffee shops:

الصورة (3): خدمات التوصيل

 

المخطط البياني شريطي يبين لنا توقيت غلق المقاهي و تبين لنا ان اغلب المقاهي تغرق بين 10 مساءا إلى 3 صباحا.

4. Rate of coffee shops:

الصورة (4): مستويات الأسعار

 

نلاحظ  في المنحنى المستويات الاسعار التي اغلبها moderate و ان تقريبا نصف المقاهي لم يحدد مستوى اسعارهم.

5. Price level map:

الان راح ننتقل الى تحليل مواقع المقاهي و توزعهم في المدن و ذلك باستعمال خريطة التي تأخذ احداثيات المقاهي كالاتي:

الصورة (5): خريطة تبين مستويات الأسعار في المدن: جدة، الرياض و الشرقية

 

الخرائط تبين لنا توزع مستويات الأسعار في المدن الثلاثة بحيث  تتمركز الاسعار المرتفعة جدا في وسط المدينتين جدة (اقرب الى البحر) وفي الرياض ( شمال الرياض) في المقابل منطقة الشرقية لا يوجد بها مقاهي  بأسعار مرتفعة جدا مع وجود عدد قليل تعتبر أسعارها مرتفعة لكن أغلبها متوسطة أو غير مرتفعة.

6. خريطة Dine in location :

الصورة (6): خريطة تبين الخدمات في المدن: جدة، الرياض و الشرقية

هنا خريطة تبين لنا خدمات الأكل التي توفرها المقاهي حسب المدن، حيث الخدمة الأكثر المتوفرة هي خدمة الأكل داخل المتجر.

7. خريطة Delivery :

الصورة (7): خريطة تبين خدمة التوصيل في المدن: جدة، الرياض و الشرقية

 

في الخريطة التوصيل نرى أن التسليم بدون تلامس هي الخدمة التي توفرها أغلب المقاهي على مستوى كل المدن (و هذا راجع لأسباب وقائية ضد جائحة كورونا).

8. خريطة  التقييم :

الصورة (8): خريطة تبين الأعلى تقييما حسب (تقييم*عدد تصويت) في المدن: جدة، الرياض و الشرقية.

 

سيحدث هذا العمل لاحقا بإضافة نموذج بايز.

 

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *