مرحباً، أنا

قبَيِّل القحطاني

مهندس بيانات خبير

أبني مسارات البيانات وأنظمة التعلم الآلي — من البيانات الخام حتى الإنتاج.

Qubayl Alqahtani
/ عني

من أنا

مهندس بيانات خبير بخبرة تتجاوز سبع سنوات عبر دورة حياة البيانات والتعلم الآلي بالكامل — من استيعاب البيانات الخام حتى أنظمة التعلم الآلي الإنتاجية. أصمم وأمتلك معمارية منصات البيانات من الألف إلى الياء، وأضع معايير هندسية وأبني البنية التحتية التي تُمكّن أنظمة التعلم الآلي من الوصول إلى الإنتاج بشكل موثوق وقابل للتوسع.

عملت عبر البيئات الحكومية وشركات التقنية عالية النمو، أجسّر الهوة بين البنية التحتية وأنظمة التعلم الآلي الإنتاجية — متولياً كل شيء من تصميم المسارات وجودة البيانات إلى نشر MLOps ومراقبة النماذج.

أحمل درجة الماجستير في نظم المعلومات من جامعة الملك سعود بتخصصات في التعلم الآلي ومعالجة اللغة الطبيعية والتنقيب في البيانات.

/ الخبرات

المسيرة المهنية

مهندس بيانات خبير

وزارة الطاقة

يناير 2025 — الحاضر

الرياض، المملكة العربية السعودية

  • بناء طبقة التحقق من جودة البيانات بين بيئة التجهيز وبيئة الإنتاج — فحوصات آلية تكشف مشكلات المسارات والبيانات قبل وصولها إلى الإنتاج، مما أسهم في خفض ملحوظ للحوادث.
  • تصميم ونشر البنية التحتية الكاملة لعمليات التعلم الآلي: سجل النماذج وتخزين الأدوات بـ MinIO وطبقة الخدمة عبر FastAPI وتنسيق العمليات بـ Airflow — مما أتاح دورات حياة آلية بالكامل وقابلة للتكرار والتوسع.
  • بناء نظام API Watcher يكشف تلقائياً عن التغييرات الهيكلية في جميع مصادر البيانات الخارجية ويُطلق تنبيهات فورية، مما أزال حالات تعطل المسارات الصامتة عبر طبقة الاستيعاب بأكملها.
  • نشر بحيرة بيانات MinIO مع تكامل أصلي مع Incorta، مما أتاح تحليلاً مباشراً على البيانات الخام الهيكلية وشبه الهيكلية وغير الهيكلية — وأزال عبء ETL عن المستهلكين في المراحل اللاحقة.
  • توحيد سير عمل التطوير لدى الفريق عبر حوكمة Git ومراجعة منهجية للكود، مما رفع الجودة الهندسية عبر فريق البيانات بأكمله.
  • الإسهام في تحقيق وزارة الطاقة المرتبة الأولى بين جميع الجهات الحكومية السعودية في مؤشر SDAIA الوطني للبيانات (NDI) 2025 — من خلال العمل التقني في مجالَي معمارية البيانات ونمذجتها (DAM) والمشاركة والتشغيل البيني للبيانات (DSI).
PythonApache AirflowApache KafkaApache SparkFastAPIMLflowMinIOSQL Server

عالم بيانات أول ومهندس عمليات التعلم الآلي

مرسول

سبتمبر 2022 — يناير 2025

الرياض، المملكة العربية السعودية

  • قيادة تسليم متكامل لأنظمة التعلم الآلي الإنتاجية لتحسين توزيع السائقين والتنبؤ بطلب العملاء، مما أسهم مباشرةً في تحسين التوازن بين العرض والطلب عبر عمليات الرياض.
  • امتلاك دورة حياة MLOps الكاملة لجميع النماذج الإنتاجية — مسارات نشر آلية ومراقبة أداء في الوقت الفعلي ولوحات Looker — مما قلّص بشكل ملحوظ أعباء التتبع اليدوي.
  • تطوير نموذج تنبؤ بالطلب يستند إلى الجيوهاش ونشره على AWS EC2، يُشغّل لوحة خريطة حرارية تُستخدم يومياً من قِبل فريق عمليات التوريد لاتخاذ قرارات التوزيع.
  • بناء نموذج تقييم الموثوقية لتحليل أنماط سلوك الشكاوى، مما سرّع دورة البت في المطالبات وحسّن معدلات الاحتفاظ بالعملاء.
  • توسيع حزمة التحليلات الداخلية بقدرات إدارة ومراقبة نماذج التعلم الآلي، مما جعلها المصدر الوحيد للحقيقة حول صحة النماذج عبر المؤسسة.
PythonMLflowScikit-LearnApache AirflowLookerMLOps

قائد جلسات — برنامج محلل البيانات

Udacityدوام جزئي

سبتمبر 2022 — يناير 2023

عن بُعد

  • تيسير تعلم الطلاب من خلال المحاضرات وورش العمل والمهام حول تنظيم البيانات والتعرف على الأنماط والنمذجة التنبؤية وتواصل البيانات.
  • تقديم تعليم في تصور البيانات بما يشمل الرسوم البيانية الشريطية والتكرارية.
  • تعليم الطلاب أساليب تقييم جودة البيانات وتنظيفها ومعالجتها.
Pythonتحليل البياناتتصور البياناتتدريس

عالم بيانات

مرسول

مايو 2020 — سبتمبر 2022

الرياض، المملكة العربية السعودية

  • بناء نموذج تصنيف شكاوى المستخدمين لتحسين نظام توزيع التذاكر.
  • إجراء التحليل الاستكشافي للبيانات لاستخلاص رؤى قيّمة تدعم استراتيجيات الأعمال القائمة على البيانات.
  • العمل على هندسة الخصائص لتحسين أداء نماذج التعلم الآلي.
  • البحث عن أنماط في البيانات توفر حلولاً للمشكلات التجارية أو تخلق فرصاً جديدة.
PythonScikit-Learnمعالجة اللغة الطبيعيةEDAهندسة الخصائصSQL

عالم بيانات مساعد

شركة تقنية المعلومات السعودية

يونيو 2018 — مايو 2020

الرياض، المملكة العربية السعودية

  • تحليل مجموعات البيانات باستخدام مهارات الرياضيات وعلوم الحاسوب تحت إشراف علماء البيانات الأقدم.
  • التعامل مع جمع البيانات والمعالجة المسبقة لتغذية نماذج التعلم الآلي.
  • بناء خوارزميات التعلم الموجَّه وغير الموجَّه واستخدام النماذج المُدرَّبة مسبقاً وفق احتياجات الأعمال.
PythonSQLScikit-LearnPandasNumPyالتعلم الآلي
/ المشاريع

أبرز الأعمال

01

إطار جودة البيانات في بيئة ما قبل الإنتاج

Pre-Production Data Quality Framework

إنشاء بيئة Pre-Prod لاختبار جودة البيانات والتحقق منها قبل نشرها في الإنتاج. وإعداد منصة Airflow لأتمتة خطوط البيانات وجدولتها، وتفعيل نظام Git لتوحيد معايير التطوير البرمجي وضمان قابلية المراجعة والتدقيق عبر الفريق.

Apache AirflowPythonSQL Serverجودة البياناتGit
02

نظام مراقبة API وحزمة الاتصال الموحدة

API Watcher & Unified Connector

بناء نظام API Watcher لرصد تغيّر هيكل الواجهات البرمجية تلقائياً والتنبيه الفوري عند حدوثها، مما يضمن استمرارية خطوط البيانات. وتطوير حزمة API Connector موحدة لمركزة إدارة الاشتراكات وتقليل جهود الصيانة المستقبلية.

PythonFastAPIApache AirflowSQL Serverتكامل API
03

بحيرة البيانات بـ MinIO — متكاملة مع Incorta

MinIO Data Lake — Incorta Integration

تصميم ونشر بحيرة بيانات باستخدام MinIO لحفظ الملفات الهيكلية وشبه الهيكلية وغير الهيكلية. وربطها مع منصة Incorta كبحيرة بيانات أصلية تتيح التحليل المباشر على البيانات الخام دون الحاجة إلى ETL. مع تطبيق سياسات دورة حياة البيانات عبر طبقات التخزين المختلفة.

MinIOPythonSQL ServerApache Airflowهندسة البيانات
04

مسار هندسة البيانات في الوقت الفعلي

Real-Time Data Engineering Pipeline

مشروع شخصي لبناء مسار متكامل لهندسة البيانات في الوقت الفعلي. يعتمد Apache Kafka للبث الفوري، وApache Spark لمعالجة البيانات الضخمة، وحزمة ELK للمراقبة الشاملة. مع Grafana وPrometheus لرصد أداء المسار، وKafka Schema Registry لإدارة الـ Schema والتحقق من صحته.

Apache KafkaApache SparkElasticsearchKibanaGrafanaPrometheus
05

نموذج التنبؤ بوقت تحضير الطلب

Order Preparation Time Prediction

نموذج تعلم آلي للتنبؤ بوقت تحضير الطلبات لتحسين توزيع السائقين بتخصيص الطلبات بناءً على وقت التحضير المقدّر. نُشر عبر API في الوقت الفعلي لتعيين الطلبات ديناميكياً.

PythonScikit-LearnFastAPISQLMLflow
06

التنبؤ بالطلب المبني على الجيوهاش

Geohash Demand Forecasting

تقسيم مدينة الرياض إلى خلايا جيوهاش باستخدام البيانات التاريخية للتنبؤ بطلب العملاء في كل منطقة. نُشر على AWS EC2 مع خريطة حرارية للجيوهاش لفريق العرض في مرسول.

PythonAWS EC2Geohashتصور البياناتالتنبؤ
07

نموذج تقييم الموثوقية

Trustworthiness Evaluation Model

نموذج تعلم آلي يقيّم موثوقية المشترين والسائقين في مرسول من خلال تحليل سلوكهم عند تقديم الشكاوى. سرّع عملية البت في الشكاوى ورفع معدلات الاحتفاظ بالعملاء.

PythonScikit-LearnتصنيفSQLMLflow
08

مساعد ذكاء اصطناعي لدعم السائقين

Conversational AI for Courier Support

روبوت محادثة سياقي للرد على الأسئلة الشائعة لسائقي مرسول، يخفف العبء عن فريق خدمة العملاء بأتمتة الردود على الاستفسارات المتكررة.

PythonRasaمعالجة اللغة الطبيعيةذكاء اصطناعي تحادثيFlask
/ المهارات

الكفاءات التقنية

هندسة البيانات

Apache SparkApache AirflowApache KafkaSQL ServerMinIOElasticsearchSchema RegistryETL/ELTData Lakes

عمليات التعلم الآلي والخدمة

MLflowFastAPIDockerCI/CDModel MonitoringIncortaLookerGrafanaPrometheus

اللغات والأدوات

PythonSQLGitPandasNumPy
/ السيرة الذاتية

السيرة الذاتية

تحميل نسخة كاملة من سيرتي الذاتية بصيغة PDF.

تحميل السيرة الذاتية
/ تواصل

تواصل معي

أرحب بالفرص والتعاون. لا تتردد في التواصل معي عبر البريد الإلكتروني أو أي من القنوات أدناه.

[email protected]

+966 53 520 9044