ما هو التعلم الآلي؟

مايكل تشن | خبير إستراتيجيات المحتوى | 25 نوفمبر 2024

أصبح التعلم الآلي مصطلحًا شائعًا في السنوات الأخيرة، إذ انتقل المفهوم من الخيال العلمي إلى محرك رئيسي لكيفية معالجة الشركات والمؤسسات للمعلومات. مع استمرار وتيرة إنشاء البيانات في النمو بشكل كبير، تُعد أدوات التعلم الآلي محورية للمؤسسات التي تتطلع إلى اكتشاف الأنماط، واستخلاص الاتجاهات، ورسم المسار الأكثر ربحية للمضي قدمًا.

ما مدى شيوع التعلم الآلي؟ إذا نقرت على توصية من موقع للتجارة الإلكترونية أو منصة بث، أو تم إعلامك بسوء استخدام محتمل لبطاقة ائتمان، أو استخدمت برنامج نسخ، فقد استفدت من التعلم الآلي. يُستخدم في التمويل والرعاية الصحية والتسويق والبيع بالتجزئة والعديد من الصناعات الأخرى لاستخراج رؤى قيّمة من البيانات وأتمتة العمليات.

ما هو التعلم الآلي؟

التعلم الآلي (ML) هو مجموعة فرعية من الذكاء الاصطناعي التي تركز على بناء أنظمة تتعلم - وتتحسن - مع استهلاك المزيد من البيانات. يُعد الذكاء الاصطناعي مصطلحًا أوسع يشير إلى الأنظمة أو الآلات التي تحاكي الذكاء البشري. وغالبًا ما تتم مناقشة التعلم الآلي والذكاء الاصطناعي معًا، ويتم استخدام المصطلحات في بعض الأحيان بالتبادل، ولكنهما لا يمثلان الشيء نفسه.

باختصار، كل ما هو تعلم آلي هو ذكاء اصطناعي، وليس العكس، فليس كل ذكاء اصطناعي هو تعلم آلي.

النقاط الرئيسة

  • التعلم الآلي هو مجموعة فرعية من الذكاء الاصطناعي.
  • الأنواع الأربعة الأكثر شيوعًا في التعلم الآلي هي: التعلم الخاضع للإشراف، والتعلم غير الخاضع للإشراف، والتعلم شبه الخاضع للإشراف، والتعلم المعزز.
  • تشمل الأنواع الشائعة لخوارزميات التعلم الآلي الشبكات العصبية وأشجار القرار والتجميع والغابات العشوائية.
  • تشمل حالات استخدام التعلم الآلي الشائعة في الأعمال تحديد الكائنات وتصنيفها، واكتشاف الحالات الشاذة، ومعالجة المستندات، والتحليل التنبؤي.

شرح التعلم الآلي

التعلم الآلي هو تقنية تكتشف العلاقات غير المعروفة سابقًا في البيانات عن طريق البحث في مجموعات بيانات كبيرة جدًا لاكتشاف الأنماط والاتجاهات التي تتجاوز التحليل الإحصائي البسيط. يستخدم التعلم الآلي خوارزميات متطورة يتم تدريبها على تحديد الأنماط في البيانات، وإنشاء نماذج. يمكن استخدام هذه النماذج لتقديم تنبؤات وتصنيف البيانات.

لاحظ أن الخوارزمية ليست هي نفسها النموذج. الخوارزمية هي مجموعة من القواعد والإجراءات المستخدمة لحل مشكلة معينة أو أداء مهمة معينة، بينما النموذج هو الناتج أو نتيجة تطبيق خوارزمية على مجموعة بيانات.

قبل التدريب، لديك خوارزمية. بعد التدريب، لديك نموذج.

على سبيل المثال، يُستخدم التعلم الآلي على نطاق واسع في مجال الرعاية الصحية لتنفيذ مهام تشمل تحليل الصور الطبية، والتحليلات التنبؤية، وتشخيص الأمراض. تُعد نماذج التعلم الآلي مناسبة تمامًا لتحليل الصور الطبية، مثل فحوصات التصوير بالرنين المغناطيسي والأشعة السينية والتصوير المقطعي المحوسب، لتحديد الأنماط واكتشاف التشوهات التي قد لا تكون مرئية للعين البشرية أو التي قد يغفل عنها طبيب تشخيصي مرهق. يمكن لأنظمة التعلم الآلي أيضًا تحليل الأعراض والمعلومات الجينية وبيانات المرضى الأخرى لاقتراح اختبارات لحالات مثل السرطان والسكري وأمراض القلب.

تتمثل السمات الرئيسية للتعلم الآلي في

  • الاكتشاف التلقائي للأنماط
  • التنبؤ بالنتائج المحتملة
  • إنشاء معلومات قابلة للتنفيذ
  • القدرة على تحليل كميات كبيرة جدًا من البيانات

أنواع التعلم الآلي

هناك أربعة أنواع رئيسية للتعلم الآلي. لكل منها نقاط قوته وقيوده، ما يجعل اختيار النهج الصحيح للمهمة المحددة أمرًا بالغ الأهمية.

  • التعلم الآلي الخاضع للإشراف هو النوع الأكثر شيوعًا. في هذا النوع، تقوم البيانات المصنفة بتعليم الخوارزمية الاستنتاجات التي يجب أن تتوصل إليها. تمامًا كما يتعلم الطفل التعرف على الفواكه عن طريق حفظها في كتاب مصور، في التعلم الخاضع للإشراف، يتم تدريب الخوارزمية بواسطة مجموعة بيانات مصنفة بالفعل. مثال على التعلم الآلي الخاضع للإشراف هو مرشح البريد الإلكتروني العشوائي، حيث يتم تدريب الخوارزمية على مجموعة بيانات مصنفة يتم فيها وضع علامة على كل بريد إلكتروني إما كبريد عشوائي أو غير عشوائي. يتعلم النموذج من هذه الأمثلة المصنفة ثم يمكنه التنبؤ بما إذا كانت رسائل البريد الإلكتروني الواردة الجديدة من المحتمل أن تكون بريدًا عشوائيًا أم لا بناءً على الأنماط التي حددها. يتطلب هذا النوع من التعلم الخاضع للإشراف خبيرًا بشريًا لتقديم الإجابات الصحيحة عن طريق تصنيف البيانات حتى تتمكن الخوارزمية من التعلم وتقديم تنبؤات دقيقة في المستقبل.

    لاحظ أن الهدف هنا ليس التدريب باستخدام بيانات مثالية أو خالية من العيوب تمامًا. أنت تريد محاكاة ما سيراه النظام في العالم الحقيقي - بعض البريد العشوائي يسهل اكتشافه، ولكن الأمثلة الأخرى مُخفاة أو يصعب تحديدها. تؤدي البيانات النظيفة بشكل مفرط إلى فرط التوافق، ما يعني أن النموذج سيحدد فقط العينات النقية الأخرى.
  • التعلم الآلي غير الخاضع للإشراف يستخدم نهجًا أكثر استقلالية، حيث يتعلم الكمبيوتر التعرف على العمليات والأنماط المعقدة دون الاعتماد على البيانات المصنفة مسبقًا. لا يتضمن التعلم الآلي غير الخاضع للإشراف التدريب بناءً على البيانات التي لا تحتوي على تصنيفات فحسب؛ بل لا توجد أيضًا مخرجات محددة ومُعرَّفة، مثل ما إذا كان البريد الإلكتروني من المحتمل أن يكون بريدًا عشوائيًا.

    التعلم الآلي غير الخاضع للإشراف يميل إلى اكتشاف تجمعات البيانات المتشابهة، وإنشاء مجموعات. بمجرد تدريب النموذج، يمكنه تحديد أنماط مماثلة ووضع تلك البيانات في مجموعتها المناسبة. الاستخدام الشائع للتعلم الآلي غير الخاضع للإشراف هو محركات التوصيات، والتي تُستخدم في تطبيقات المستهلكين لتقديم اقتراحات "العملاء الذين اشتروا ذلك اشتروا هذا أيضًا". عند العثور على أنماط غير متشابهة، يمكن للخوارزمية تحديدها على أنها حالات شاذة، وهو أمر مفيد في اكتشاف الاحتيال.
  • التعلم الآلي شبه الخاضع للإشراف يعالج مشكلة عدم وجود بيانات مصنفة كافية لتدريب نموذج بشكل كامل. على سبيل المثال، قد تكون لديك مجموعات بيانات تدريب كبيرة ولكنك لا ترغب في تحمّل الوقت والتكلفة اللازمين لتصنيف المجموعة بأكملها. باستخدام مزيج من الطرق الخاضعة للإشراف وغير الخاضعة للإشراف، يمكنك غالبًا تحقيق نموذج مدرَّب بالكامل. تبدأ عملية التدريب مثل التعلم الخاضع للإشراف، باستخدام البيانات المصنفة للحصول على نتائج أوليّة ووضع إرشادات للخوارزمية. عند استنفاد البيانات المصنفة، يتم إعطاء النموذج شبه المدرَّب مجموعات البيانات غير المصنفة. إنه يستخدم التدريب الذي تلقاه وينظر إلى البيانات غير المصنفة، بهدف الإضافة إلى مجموعة البيانات المصنفة. إذا استطاع النموذج العثور على تصنيف مناسب لعينة بدرجة عالية من التأكد، تُضاف تلك العينة إلى البيانات المصنفة. تبدأ عملية التعلم مرة أخرى، ولكن الآن بمجموعة أكبر من العينات المصنفة. من خلال التكرار، يتم تصنيف المزيد من العينات بما يسمى غالبًا التصنيفات الزائفة، ويمكن تحسين النموذج بشكل أكبر.

    التعلم الآلي المعزز، مثل التعلم الآلي غير الخاضع للإشراف، يستخدم مجموعات بيانات غير مصنفة ويسمح للخوارزميات بتقييم البيانات. ومع ذلك، يختلف التعلم المعزز في أنه يعمل لتحقيق هدف محدد بدلاً من استكشاف البيانات لاكتشاف أي أنماط قد تكون موجودة. مع وضع هدف في الاعتبار، تتقدم الخوارزمية في عملية التجربة والخطأ. تتلقى كل خطوة تعليقات إيجابية أو سلبية أو محايدة، والتي تستخدمها الخوارزمية لصقل عملية صنع القرار الشاملة الخاصة بها. يمكن لخوارزميات التعلم المعزز أن تعمل على مستوى كلي نحو هدف المشروع، حتى لو كان ذلك يعني التعامل مع عواقب سلبية قصيرة الأجل. بهذه الطريقة، يتعامل التعلم المعزز مع مواقف أكثر تعقيدًا وديناميكية من الطرق الأخرى لأنه يسمح لسياق هدف المشروع بالتأثير على المخاطر في الخيارات. يُعد تعليم الكمبيوتر لعب الشطرنج مثالاً جيدًا. الهدف العام هو الفوز باللعبة، ولكن ذلك قد يتطلب التضحية بقطَع مع تقدم اللعبة.

ما النهج الأفضل الذي يناسب احتياجاتك؟ يعتمد اختيار النهج الخاضع للإشراف أو إحدى الطرق الثلاث الأخرى عادةً على بنية وحجم بياناتك، والميزانية والساعات التي يمكن تخصيصها للتدريب، وحالة الاستخدام التي تريد تطبيق النموذج النهائي عليها. قد يكون التغاضي عن اقتراح بلوزة لتتناسب مع تنورة غير ذي أهمية. أما تفويت ورم فله عواقب وخيمة.

كيفية عمل التعلم الآلي

كما يشير اسمه، يعمل التعلم الآلي عن طريق إنشاء نماذج إحصائية قائمة على الكمبيوتر يتم تحسينها لغرض معين عن طريق تقييم بيانات التدريب، بدلاً من النهج الكلاسيكي حيث يطور المبرمجون خوارزمية ثابتة تحاول حل مشكلة. مع تمرير مجموعات البيانات عبر نموذج التعلم الآلي، يتم الحكم على الناتج من حيث الدقة، ما يسمح لعلماء البيانات بتعديل النموذج من خلال سلسلة من المتغيرات الثابتة، تسمى المَعلمَات الفائقة، والمتغيرات المعدلة خوارزميًا، تسمى مَعلمَات التعلم.

نظرًا لأن الخوارزمية تتكيف في أثناء تقييم بيانات التدريب، فإن عملية التعرض والحساب حول البيانات الجديدة تدرب الخوارزمية على أن تصبح أفضل فيما تفعله. الخوارزمية هي الجزء الحسابي من المشروع، بينما مصطلح "النموذج" هو خوارزمية مدربة يمكن استخدامها لحالات استخدام العالم الحقيقي.

سيحدد نطاق مشاريع التعلم الآلي ومواردها وأهدافها المسار الأنسب، ولكن معظمها يتضمن سلسلة من الخطوات.

1. جمع البيانات وتجميعها

يتطلب تدريب نماذج التعلم الآلي الكثير من البيانات عالية الجودة. غالبًا ما يكون العثور عليها صعبًا، وقد يكون تصنيفها، إذا لزم الأمر، كثيفًا جدًا للموارد. بعد تحديد مصادر البيانات المحتملة، قم بتقييمها لتحديد الجودة الشاملة والتوافق مع موارد تكامل/مستودع البيانات الحالية للمشروع. تشكّل هذه المصادر الأساس التدريبي لمشروع تعلم آلي.

2. اختيار خوارزمية مناسبة لإنتاج النموذج المطلوب

اعتمادًا على ما إذا كان المشروع يخطط لاستخدام التعلم الخاضع للإشراف أو غير الخاضع للإشراف أو شبه الخاضع للإشراف، يمكن لعلماء البيانات اختيار الخوارزميات الأكثر ملاءمة. على سبيل المثال، يمكن لمشروع أبسط مع مجموعة بيانات مصنفة استخدام شجرة قرار، بينما يتطلب التجميع - تقسيم عينات البيانات إلى مجموعات من الكائنات المتشابهة - المزيد من موارد الحوسبة إذ تعمل الخوارزمية دون إشراف لتحديد أفضل مسار لهدف معين.

3. تحسين البيانات وإعدادها للتحليل

من المحتمل أن البيانات الواردة لن تكون جاهزة للاستخدام. ينظّف إعداد البيانات مجموعات البيانات لضمان إمكانية استيعاب جميع السجلات بسهولة في أثناء التدريب. يتضمن الإعداد مجموعة من مهام التحويل، مثل إنشاء تنسيقات التاريخ والوقت، وضم أو فصل الأعمدة حسب الحاجة، وتعيين مَعلمَات التنسيق الأخرى، مثل الأرقام المعنوية المقبولة في بيانات الأرقام الحقيقية. تشمل المهام الرئيسية الأخرى تنظيف السجلات المكررة، والتي تسمى أيضًا إزالة تكرار البيانات، وتحديد وربما إزالة القيم المتطرفة.

4. تعليم النموذج من خلال التدريب

بمجرد تحديد النموذج النهائي المطلوب، تبدأ عملية التدريب. في التدريب، تتم تغذية مجموعة بيانات مُنسقة، إما مصنفة أو غير مصنفة، إلى الخوارزمية. في عمليات التشغيل الأوليّة، قد لا تكون النتائج رائعة، ولكن علماء البيانات سيقومون بالتعديل حسب الحاجة لتحسين الأداء وزيادة الدقة. ثم يتم عرض البيانات على الخوارزمية مرة أخرى، عادةً بكميات أكبر لضبطها بدقة أكبر. كلما زادت البيانات التي تراها الخوارزمية، كان النموذج النهائي أفضل في تقديم النتائج المرجوة.

5. تقييم أداء النموذج ودقته

بعد تدريب النموذج بدقة كافية، يكون قد حان الوقت لمنحه بيانات غير مرئية سابقًا لاختبار أدائه. غالبًا ما تكون البيانات المستخدمة للاختبار مجموعة فرعية من بيانات التدريب مخصصة للاستخدام بعد التدريب الأوّلي.

6. ضبط مَعلمَات النموذج وتحسينها

من المرجح الآن أن يكون النموذج قريبًا من النشر. يجب أن تنتج عمليات التشغيل مع مجموعات بيانات الاختبار نتائج دقيقة للغاية. تحدث التحسينات من خلال تدريب إضافي ببيانات محددة - غالبًا ما تكون فريدة لعمليات الشركة - لتكملة البيانات المعممة المستخدمة في التدريب الأصلي.

7. إطلاق النموذج

مع تحسين النتائج، أصبح النموذج الآن جاهزًا للتعامل مع البيانات غير المرئية سابقًا في الاستخدام الإنتاجي العادي. عندما يكون النموذج مباشرًا، ستجمع فرق المشروع بيانات حول كيفية أداء النموذج في سيناريوهات العالم الحقيقي. يمكن القيام بذلك عن طريق مراقبة مقاييس الأداء الرئيسية، مثل الدقة، والصحة الإجمالية لتنبؤات النموذج، والاستدعاء، ونسبة الملاحظات الإيجابية المتوقعة بشكل صحيح. ضع في اعتبارك أيضًا كيف تؤثر تنبؤات النموذج على نتائج الأعمال على أرض الواقع - هل تولّد قيمة، سواءً في زيادة مبيعات البلوزات أو تحسين التشخيص؟

يمكن أن يساعد إجراء عمليات تدقيق ومراجعات منتظمة لأداء النموذج في تحديد المشكلات أو التشوهات التي ربما نشأت بعد النشر وهي ضرورية لضمان أداء النموذج بفعالية وتحقيق الأهداف المرجوة.

كيفية عمل التعلم الآلي

خوارزميات التعلم الآلي

الخوارزميات هي الجزء الحسابي من مشروع التعلم الآلي. بمجرد تدريبها، تنتج الخوارزميات نماذج ذات احتمالية إحصائية للإجابة عن سؤال أو تحقيق هدف. قد يكون هذا الهدف هو العثور على ميزات معينة في الصور، مثل "تحديد جميع القطط"، أو قد يكون اكتشاف الحالات الشاذة في البيانات التي يمكن أن تشير إلى احتيال أو بريد عشوائي أو مشكلة صيانة في آلة. قد تحاول خوارزميات أخرى تقديم تنبؤات، مثل عناصر الملابس التي قد يحبها المشتري أيضًا بناءً على ما هو موجود حاليًا في عربة التسوق.

فيما يلي بعض الخوارزميات الأكثر شيوعًا المستخدمة في التعلم الآلي:

  • الشبكات العصبية: يعمل الدماغ البشري عن طريق إنشاء شبكات من العُقد التي تؤدي وظائف متنوعة مثل معالجة الصور من أعيننا وتخزين الذكريات والتحكم في عضلاتنا. يتم تصميم الشبكات العصبية القائمة على الكمبيوتر على غرار بنية الدماغ هذه، ما يخلق طبقات من العُقد التي تزن العلاقات بين البيانات التي تم تحليلها والبيانات في العُقد المجاورة. من خلال العمل كشبكة، يمكن لهذه العُقد تحديد ميزات البيانات، مثل العناصر الموجودة داخل الصورة.
  • الانحدار الخطي: تأخذ خوارزميات الانحدار الخطي نقاط البيانات وتبني معادلة رياضية لخط يدعم أفضل النتائج المتوقعة. يُعرف هذا أحيانًا باسم "خط أفضل ملاءمة". يعمل الانحدار الخطي عن طريق تعديل المتغيرات في المعادلة لتقليل الأخطاء في التنبؤات. مثال على الانحدار الخطي يظهر في رعاية الأطفال، إذ يمكن لنقاط البيانات المختلفة التنبؤ بطول الطفل ووزنه بناءً على البيانات التاريخية. وبالمثل، فإن مؤشر كتلة الجسم هو انحدار خطي يحاول ربط الطول والوزن بالدهون الكلية في الجسم. نظرًا لأن الخوارزمية تستخدم خطًا بسيطًا لتنبؤاتها، فقد تكون معدلات الخطأ عالية. على سبيل المثال، يشير مؤشر كتلة الجسم 30 إلى السمنة. غالبًا ما يكون هذا صحيحًا بالنسبة لعامة الناس، ولكنه بالتأكيد ليس صحيحًا بالنسبة لرياضيي القوة مثل لاعبي خط الدفاع في دوري كرة القدم الأمريكية.
  • الانحدار اللوجستي: يُستخدم الانحدار اللوجستي بشكل أفضل للنتائج الثنائية، وهو يشبه الانحدار الخطي ولكنه يحتوي على اعتبارات خاصة عند حدود نطاقات البيانات المحتملة. مثال على الانحدار اللوجستي يشمل تحليل النجاح/الفشل في احتمالية تحويل عميل محتمل إلى عميل يدفع. غالبًا ما يُستخدم الانحدار اللوجستي في التشخيصات الطبية - على سبيل المثال، تُستخدم تركيزات جلوكوز البلازما فوق نطاق معين كمؤشر قوي على مرض السكري. يمكن أيضًا استخدام الانحدار اللوجستي للتنبؤ بما إذا كان البريد الإلكتروني عشوائيًا أم لا، أو إذا كانت معاملة بطاقة ائتمان احتيالية.
  • التجميع: التجميع هو شكل من أشكال التعلم غير الخاضع للإشراف الذي يُعرّض خوارزمية لمجموعات بيانات غير مصنفة قد تندرج فيها البيانات في مجموعات مميزة. في أثناء تقييم الخوارزمية لبيانات التدريب، فإنها تبحث عن أنماط وتفاصيل متداخلة بين البيانات وتنشئ مجموعات. لنفترض أن الخوارزمية تنظر إلى القيمة الغذائية لمجموعة متنوعة من الفواكه. قد تجد أن الحمضيات تشكّل مجموعة واحدة، والتوت يشكّل مجموعة أخرى، والبطيخ يشكّل مجموعة ثالثة. يتيح ذلك فهمًا أسهل لما يجعل كل مجموعة فريدة من نوعها. يُعد التجميع مفيدًا بشكل خاص لأي نوع من أنواع مشاريع التصنيف، مثل تجزئة السوق.
  • أشجار القرار: تستخدم أشجار القرار التعلم الخاضع للإشراف وتتابعات إذا-ثم الأساسية لتقديم تنبؤات. اعتمادًا على تعقيد المشروع، يمكن أن تكون أشجار القرار مثالية كخوارزميات خفيفة الموارد تنتج نتائج مباشرة. على سبيل المثال، إذا أرادت كلية تحديد الطلاب الذين يمكنهم تخطي اللغة الإنجليزية للمبتدئين، فقد تستخدم شجرة قرار تسأل أولاً عما إذا كان الطالب قد درس اللغة الإنجليزية لمدة أربع سنوات في المدرسة الثانوية، وإذا كان الأمر كذلك، فهل حصل الطالب على معدل تراكمي 3.6 على الأقل في تلك الفصول. قد يسأل مسار آخر ببساطة عما إذا كان الطالب قد حصل على درجة أفضل من عتبة معينة في أقسام القراءة والكتابة واللغة في اختبار SAT.
  • الغابات العشوائية: بمفردها، تنطوي أشجار القرار على قيود بسبب سير العمل الجامد المتأصل فيها ومتطلبات الإجابة عن جميع أسئلة التقييم. في مثال شجرة القرار أعلاه، قد تتطلب الكلية أن يكون كلا الشرطين صحيحين، على الرغم من أن تلبية شرط واحد فقط قد يكون كافيًا. وقد تكون هناك عوامل أخرى يجب مراعاتها، مثل مدى جودة أداء الطالب في مقال القبول. إذا كانت جميع العوامل الثلاثة مطلوبة، فستواجه الكلية مشكلة تتطلب "تجاوز التوافق" لشجرة القرار. من المرجح جدًا أن يكون الطلاب الذين حققوا أداءً جيدًا في المعايير الثلاثة قادرين على تخطي مقرر اللغة الإنجليزية 101. ومع ذلك، سيظل الآخرون الذين سيكونون على ما يرام مطالَبين بأخذ الفصل. تجمع الغابات العشوائية بين مجموعات من أشجار القرار التي تزن بشكل تراكمي النتائج لتقديم منظور أوسع. باستخدام الغابات العشوائية، لا تزال المشاريع تستخدم الآليات الأساسية لأشجار القرار مع مراعاة العلاقات الدقيقة بين نقاط البيانات ذات الصلة. لذلك، قد تقسم كليتنا هذه المعايير الثلاثة إلى أشجار قرار منفصلة ثم تستخدم أوزانًا لتحديد مَن يمكنه تخطي مقرر اللغة الإنجليزية 101 بناءً على نتيجة، ربما، أن الأداء الجيد في اللغة الإنجليزية في المدرسة الثانوية هو المؤشر الأكثر تنبؤًا وأن الأداء في المقال هو الأقل.

ما وراء الشبكات العصبية

يستخدم التعلم الآلي مجموعة واسعة من الخوارزميات. بينما تتربع الخوارزميات المذكورة أعلاه على عرش الشعبية، إليك خمس خوارزميات أقل شيوعًا ولكنها لا تزال مفيدة.

تعزيز التدرج (Gradient boosting) خوارزمية تبني نماذج بالتتابع من خلال التركيز على الأخطاء السابقة في التسلسل. مفيدة لاكتشاف الاحتيال والبريد العشوائي.
خوارزمية الجيران الأقرب (K-nearest neighbors - KNN) نموذج بسيط ولكنه فعال يصنف نقاط البيانات بناءً على تصنيفات أقرب جيران لها في بيانات التدريب.
تحليل المكونات الرئيسية (Principal component analysis - PCA) خوارزمية تقلل من أبعاد البيانات عن طريق تحديد أهم الميزات. مفيدة للتصور وضغط البيانات، على سبيل المثال، لاكتشاف الحالات الشاذة.
التعلم كيو (Q-learning) خوارزمية تستخدم وكيلاً يتعلم من خلال التجربة والخطأ، ويتلقى مكافآت للإجراءات المرغوبة وعقوبات لاتخاذ الخطوة الخاطئة.
آلات المتجهات الداعمة (Support vector machines - SVM) خوارزمية تنشئ مستوى فائقًا لفصل نقاط البيانات التي تنتمي إلى فئات مختلفة بشكل فعال، مثل تصنيف الصور.

فوائد التعلم الآلي

يتيح التعلم الآلي للمؤسسات استخلاص رؤى من بياناتها قد لا تتمكن من العثور عليها بأي طريقة أخرى. تشمل بعض الفوائد الأكثر شيوعًا من دمج التعلم الآلي في العمليات ما يلي:

  • تبسيط اتخاذ القرار والتحليل التنبؤي: تبدأ القرارات القائمة على البيانات بتحليل البيانات. هذا بيان بديهي، ولكن عند إعداده يدويًا، تكون عملية التحليل مستهلكة للوقت والموارد وقد لا تسفر عن رؤى غنية بما يكفي لتبرير التكلفة. يمكن للتعلم الآلي فحص كميات كبيرة من البيانات لتحديد الاتجاهات والأنماط بحيث يمكن للمستخدمين التركيز على الاستعلامات والنتائج القابلة للتنفيذ بدلاً من تحسين معالجة البيانات اليدوية. اعتمادًا على أداة التحليل، يمكن للتعلم الآلي إنشاء تنبؤات وتحديد رؤى يصعب العثور عليها في البيانات، ما يسمح بعمق أكبر للتحليل وتحقيق قيمة أكبر للمؤسسة.
  • تعزيز الكفاءة وأتمتة المهام: يقع التعلم الآلي في صميم العديد من التقنيات التي تجعل العمال أكثر كفاءة. يتم الآن تنفيذ العديد من المهام المتكررة ذات المعرفة المنخفضة - بما في ذلك التدقيق الإملائي بالإضافة إلى رقمنة المستندات وتصنيفها - بواسطة أجهزة الكمبيوتر، وذلك بفضل التعلم الآلي.

    يتفوق التعلم الآلي أيضًا في تحليل البيانات السريع الفوري الذي يصعب للغاية على البشر القيام به. هل هذه المعاملة احتيالية، أم أن هذا البريد الإلكتروني عملية تصيد احتيالي؟ يمكن لأنظمة التعلم الآلي غالبًا تحديد الإجابة بدقة في ثوانٍ واتخاذ التدابير المناسبة تلقائيًا. من خلال الجمع بين تقنيات التعلم الآلي، يمكن تقديم تنبؤات من البيانات مصحوبة بتفسيرات للعوامل التي أثرت على التنبؤ، ما يساعد المديرين التنفيذيين على رسم أفضل المسارات لمؤسساتهم.
  • التخصيص والابتكار في الخدمات: فتح التعلم الآلي بابًا جديدًا لتجارب العملاء من خلال التخصيص. يمكن استخدام سجل الشراء وسجل التصفح والبيانات الديموغرافية والمعلومات الإضافية لبناء ملف تعريف عميل فردي، والذي يمكن بعد ذلك الرجوع إليه بشكل متقاطع مع ملفات تعريف مماثلة لتقديم تنبؤات حول اهتمامات العملاء. يتيح ذلك تقديم اقتراحات محرك، وخصومات تلقائية، وأنواع أخرى من المشاركة المخصصة للحفاظ على عودة العملاء.

    باستخدام المصطلحات التي تمت مناقشتها هنا: يمكن أن تساعد أشجار القرار في تصنيف العملاء. ربما يحب أحد العملاء الأزياء القديمة والمستعملة بينما يحب عميل آخر ملابس المصممين المتطورة. يمكن أن يساعد تجميع كل عميل مع العملاء المتشابهين في تحديد المنتجات التي من المحتمل أن ينقروا عليها أو ما إذا كانوا من المرجح أن يكونوا متحمسين للغاية للمبيعات. يمكن للتعلم الآلي بعد ذلك التنبؤ بأفضل العروض لكل عميل من خلال النظر في المجموعات التي ينتمون إليها.

تحديات التعلم الآلي

تعتمد فعالية مشاريع التعلم الآلي على جودة النظام والموارد التي يتم بناؤها بها. وهذا يسلط الضوء على الحاجة إلى الاستثمار في التخطيط والإعداد المناسبين.

فيما يلي بعض التحديات الأكثر شيوعًا التي تواجه مشاريع التعلم الآلي:

  • جودة البيانات: تنطبق المقولة الشائعة "مدخلات سيئة، مخرجات سيئة" على التعلم الآلي - جودة البيانات أمر بالغ الأهمية، سواءً خلال مرحلة التدريب أو في مرحلة الإنتاج. يمكن أن تؤدي البيانات عالية الجودة إلى الحصول على نتائج أكثر دقة تُقدَّم في الوقت المناسب وبكفاءة؛ بينما يمكن أن تؤدي البيانات منخفضة الجودة إلى عدم الدقة والتشويه في النماذج الناتجة. لاحظ أن "الجودة" يمكن أن تعني أشياء مختلفة لمشاريع مختلفة. لتدريب أنظمة التعرف على الصور، يجب أن تمثل البيانات ما سيراه النموذج في العالم الحقيقي. يشمل ذلك صورًا لأهداف في الظل، أو غير واضحة قليلاً، أو لا تنظر مباشرةً إلى الكاميرا. لأغراض التدريب، كلما كانت البيانات تشبه ما سيراه النظام في الإنتاج، كان ذلك أفضل.

    تحقيقًا لهذه الغاية، يجب على المؤسسات فحص مصادر البيانات، وتحويل مجموعات البيانات لتنسيقات متسقة ومتوافقة، وتشغيل إجراءات التنظيف وإزالة التكرار، وتدريب المستخدمين على العمليات والبروتوكولات، ودمج الأدوات لتقييم الجودة والملاءمة.
  • التحيز: قد تكون البيانات نظيفة، ولكن هل هي خالية من التحيز؟ كمثال واضح، لنفترض أنك تريد تدريب نظام تعلم آلي لاكتشاف الكلاب في الصور، ولديك مجموعة بيانات قوية من صور كلاب لابرادور وكلاب بودل فحسب. بعد التدريب، يكون النموذج رائعًا في اكتشاف هذه الكلاب - يمكنك القول إنه متحيز للقيام بذلك. ولكن عند عرض صورة لكلب بولدوج، يقول إنه لا يستطيع العثور على كلب. بالطبع لا - لم يتم تدريبه على ذلك.

    يُعد إنشاء مجموعة بيانات التدريب الصحيحة أحد أصعب وأغلى جوانب بناء أدوات التعلم الآلي التي تعمل بالطريقة التي تريدها. يمكن أن تؤدي صعوبة العثور على أنواع معينة من البيانات غالبًا إلى إنشاء مصدر غير مقصود للتحيز. على سبيل المثال، كلب التبت ماستيف هو سلالة نادرة، ولكن الكلاب تبدو مثل كلب نيوفاوندلاند بني برتقالي. لذلك، إذا كانت هناك عينات بيانات غير كافية لكلب التبت ماستيف، فلن يكون من المستغرب إذا حدد نموذج التعلم الآلي أنه كلب نيوفاوندلاند.
  • أمان البيانات: على الرغم من فوائد التعلم الآلي العديدة، يمكن أن يقدم مجموعة من مشكلات الأمان. قد تحتوي البيانات المستخدمة في تحليل التعلم الآلي على معلومات حساسة أو ملكية غير مخصصة للاستهلاك العام. وبالمثل، قد تكون البيانات هدفًا لهجوم إلكتروني يهدف إلى تسميم النموذج وبناء معلومات خاطئة في النتائج. يمكن لخطوات إعداد البيانات أن تكشف الثغرات الأمنية وتعالجها، خاصةً عندما تمر مجموعات البيانات بعمليات التصدير أو الاستيراد بين الأنظمة. للمساعدة في تخفيف مشكلات الأمان، يجب على الشركات استخدام مجموعة من السياسات والإجراءات والضوابط الأمنية، بما في ذلك تدريب الموظفين العملي.
  • خصوصية البيانات: ضمان عدم الكشف عن البيانات الحساسة هو جهد مستمر. يُعد إخفاء هوية البيانات ممارسة ناشئة، ولكنه قد لا يكون متاحًا أو كافيًا دائمًا. على سبيل المثال، لنفترض أن شركة تريد تقديم خدمة تسمح لعملائها من الشركات بمعرفة المزيد عن المستهلكين النهائيين بناءً على البيانات التي جمعتها. يجب حماية هذا النوع من المعلومات واستخدامه بما يتوافق مع المتطلبات القانونية، وستحتاج الشركات إلى النظر بعناية في ناقلات التهديد الجديدة التي قد تحاول اختراق البيانات من خلال نظام التعلم الآلي.

حالات استخدام التعلُّم الآلي

يمكن أن يوفر التعلم الآلي فوائد كبيرة لكل صناعة وكل قسم داخل المؤسسة. إذا تم إجراء العمليات الحسابية وكانت البيانات موجودة، فإن التعلم الآلي يوفر طريقة لزيادة الكفاءة واستخلاص أنواع جديدة من المشاركة. تشمل حالات استخدام التعلم الآلي الشائعة عبر الصناعات ما يلي:

  • البيع بالتجزئة: بالنسبة إلى تجار التجزئة، يمكن أن يساعد التعلم الآلي في العمليات والمبيعات والمزيد. على المستوى التشغيلي، يمكن للتعلم الآلي تحليل بيانات سلسلة التوريد للمساعدة في تحسين إدارة المخزون وتحديد التأخيرات المحتملة في وقت مبكر. للمساعدة في زيادة المبيعات، يمكن للتعلم الآلي فحص سجل البحث والتصفح الخاص بالعميل جنبًا إلى جنب مع التركيبة السكانية لبناء ملف تعريف يعمل كأساس لمزيد من المشاركة.
  • وسائط البث: مثل تجار التجزئة، يمكن لمشغلي بث الصوت والفيديو بناء ملفات تعريف العملاء استنادًا إلى مشاركة المستخدم وسجل التصفح والبيانات الديموغرافية. يمكن لملف التعريف هذا تشغيل محركات التوصيات التي تساعد في الاكتشاف والمشاركة الإضافية.
  • التمويل: أحد أقوى استخدامات التعلم الآلي وأبسطها هو اكتشاف الاحتيال في الصناعة المالية. باستخدام التعلم الآلي، يمكن للخوارزميات تحديد سلوك الحساب العام، ثم البدء في وضع علامة على السلوك الشاذ لإجراء تحقيقات احتيال محتملة.
  • الرعاية الصحية: صناعة الرعاية الصحية مهيأة لاستخدام التعلم الآلي في كل جانب تقريبًا من جوانب العمليات. يمكن لملفات تعريف المرضى التي يتم الحصول عليها من خلال السجلات الصحية الإلكترونية تحديد المشكلات المحتملة مسبقًا بناءً على الأنماط مقارنةً بالتركيبة السكانية المماثلة. يمكن لبيانات من أجهزة إنترنت الأشياء، مثل موزع أدوية ذكي، أن تكشف الأخطاء بسرعة، وبيانات التشغيل من حركة المرضى أو استخدام أسرّة المستشفيات يمكن أن تساعد في تحديد عدد الموظفين المطلوب.

تعلم آلي أسرع وأكثر أمانًا مع Oracle

يقدم التعلم الآلي في Oracle Database مجموعة من الإمكانات والميزات لتسريع عملية التعلم الآلي. مع القدرة على الاحتفاظ بالبيانات داخل قاعدة البيانات، يمكن لعلماء البيانات تبسيط سير عملهم وزيادة الأمان مع الاستفادة من أكثر من 30 خوارزمية مدمجة وعالية الأداء؛ ودعم اللغات الشائعة، بما في ذلك R وSQL وPython؛ وإمكانات التعلم الآلي الآلية؛ وواجهات دون تعليمات برمجية.

بالنسبة إلى المؤسسات التي لديها مجموعات بيانات كبيرة، فإن التعلم الآلي داخل قاعدة البيانات مع HeatWave MySQL يلغي الحاجة إلى نقل البيانات إلى نظام منفصل للتعلم الآلي، ما يمكن أن يساعد في زيادة الأمان وخفض التكاليف وتوفير الوقت. يعمل HeatWave AutoML على أتمتة دورة حياة التعلم الآلي، بما في ذلك اختيار الخوارزمية وأخذ عينات البيانات الذكية للتدريب واختيار الميزات والضبط، ما يوفر غالبًا المزيد من الوقت والجهد.

العائد من التعلم الآلي هو القدرة على تحليل وتفسير كميات كبيرة من البيانات بسرعة ودقة. بمجرد التدريب، يمكن لنماذج التعلم الآلي تحديد الأنماط والاتجاهات والرؤى في ثوانٍ أو دقائق والتي يمكن أن تستغرق أسابيع من البشر للكشف عنها - أو التي قد لا ترى النور أبدًا. والنتيجة هي اتخاذ قرارات أكثر استنارة، وتحسين حل المشكلات، والقدرة على تقديم تنبؤات قائمة على البيانات. بالإضافة إلى ذلك، يمكن لنماذج التعلم الآلي أتمتة العمليات الروتينية، ما يوفر الوقت والموارد. يحقق التعلم الآلي إمكاناته لإحداث ثورة في مكان العمل ودفع الابتكار.

التعلم الآلي هو المفتاح لإطلاق القيمة في بياناتك - والخطوة الأولى في برنامج ذكاء اصطناعي ناجح.

الأسئلة الشائعة حول التعلم الآلي

ما الفرق بين الذكاء الاصطناعي والتعلم الآلي؟

الذكاء الاصطناعي هو الاسم الذي يُطلق على مجال الحوسبة الواسع الذي يركز على بناء وتطوير أنظمة تفكر مثل البشر. التعلم الآلي هو مجموعة فرعية من مجال الذكاء الاصطناعي تركز تحديدًا على الجانب الحسابي لعملية التعلم. غالبًا ما يُستخدم المصطلحان بالتبادل ويواجهان تحديات مماثلة، ولكنهما موجودان بشكل منفصل على الرغم من هذه الصلة.

ما الأنواع الأربعة الرئيسية للتعلم الآلي؟

الأنواع الأربعة للتعلم الآلي هي كما يلي:

  • التعلم الخاضع للإشراف. يستخدم التعلم الخاضع للإشراف مجموعات بيانات مصنفة لتدريب الخوارزمية نحو هدف محدد.
  • التعلم غير الخاضع للإشراف. يستخدم التعلم غير الخاضع للإشراف مجموعات بيانات غير مصنفة توفر للخوارزمية مساحة للاستكشاف وتحديد الأنماط.
  • التعلم شبه الخاضع للإشراف. يستخدم التعلم شبه الخاضع للإشراف مجموعات بيانات مصنفة للتدريب الأوّلي لوضع المعايير العامة للمشروع. ثم تستخدم الخوارزمية هذا التدريب لتقييم العينات غير المصنفة لمعرفة ما إذا كان بإمكانها تصنيفها باحتمالية عالية. يمكن تكرار هذه العملية - مع نمو مجموعة العينات المصنفة بشكل أكبر في كل تكرار.
  • التعلم المعزز. يعمل التعلم المعزز بشكل مشابه للتعلم غير الخاضع للإشراف من حيث إنه يستخدم مجموعات بيانات غير مصنفة. ومع ذلك، يركز التعلم المعزز على تعلم أفضل مسار لتحقيق هدف محدد من خلال ردود فعل إيجابية وسلبية ومحايدة بدلاً من البحث عن الأنماط.

هل تعلم التعلم الآلي صعب؟

مثل أي حرفة تقنية، فإن تعلم تفاصيل التعلم الآلي هو عملية تكرارية تتطلب الوقت والتفاني. نقطة انطلاق جيدة للتعلم الآلي هي امتلاك أساس في لغات البرمجة، مثل Python أو R، إلى جانب فهم الإحصاء. يتطلب العديد من العناصر المتعلقة بتقييم مخرجات التعلم الآلي فهم المفاهيم الإحصائية، مثل الانحدار والتصنيف والتوافق والمعلمات.

هل من أمثلة على التعلم الآلي؟

أحد الأمثلة الأكثر شيوعًا للتعلم الآلي هو محرك اقتراحات. في التجارة الإلكترونية، يظهر ذلك كاقتراح منتج "قد يعجبك أيضًا...". في وسائط بث الفيديو، يظهر ذلك كأفكار لما يجب مشاهدته بعد ذلك. في هذه الحالات، تأخذ الخوارزمية تاريخ المستخدم وتنشئ تنبؤات لما قد يجده المستخدم مثيرًا للاهتمام - وكلما أضاف المستخدم نقاط بيانات، تمكنت الخوارزمية من تحسين التنبؤات.