Home عربي يعاني الذكاء الاصطناعي العربي من مشكلة ثقة، وليس مشكلة لغوية

يعاني الذكاء الاصطناعي العربي من مشكلة ثقة، وليس مشكلة لغوية

26
0

لماذا لا تزال نماذج الذكاء الاصطناعي العالمية تكافح مع اللغة العربية.. وكيف تحول التكنولوجيا الخاصة بالمنطقة الدقة إلى ميزة تجارية

مقال بقلم محمد الطاسان، الرئيس التنفيذي المؤسس لشركة OmniOps

وهم الطلاقة

اللغة العربية هي لغة الحكومات والشركات والمؤسسات في جميع أنحاء الخليج. إنها لغة العقود واللوائح والإفصاحات المالية والخدمات العامة. ومع تسارع تبني الذكاء الاصطناعي في جميع أنحاء المنطقة ــ حيث تعهدت المملكة العربية السعودية وحدها بمبلغ 100 مليار دولار من خلال مشروع Transcendence لتصبح من بين أفضل 15 دولة في مجال الذكاء الاصطناعي بحلول عام 2030 ــ يفترض كثيرون أن تحدي اللغة قد تم حله إلى حد كبير.

ففي نهاية المطاف، يمكن لنماذج الذكاء الاصطناعي الرائدة اليوم إنتاج لغة عربية تبدو بطلاقة وطبيعية ومقنعة. لكن الطلاقة ليست مثل الدقة. في البيئات عالية المخاطر مثل الخدمات المصرفية والرعاية الصحية والخدمات القانونية والعمليات الحكومية، لا يزال من الممكن لأنظمة الذكاء الاصطناعي أن تسيء فهم المعنى الهيكلي للنص العربي بينما تنتج استجابات تبدو صحيحة تمامًا.

هذه هي فجوة الذكاء الاصطناعي العربية الجديدة: غالبًا ما تبدو النماذج صحيحة حتى عندما تكون خاطئة.

في اللغة العربية، يمكن لعلامة تشكيل واحدة أن تحدد ما إذا كان الاسم هو الفاعل أو المفعول به في الجملة. يمكنه تغيير من حصل على العقد، أو من سمح بالدفع، أو من يتحمل المسؤولية القانونية. في معظم النصوص العربية الرقمية، يتم حذف هذه العلامات بالكامل. يحل المتحدثون الأصليون هذا الغموض من خلال السياق. كثيرًا ما تفشل نماذج الذكاء الاصطناعي في القيام بذلك.

وجدت دراسة ALPS (مجموعة اللغة العربية والبراغماتية) التي نُشرت في عام 2026 أن العديد من النماذج الحدودية حققت أداءً جيدًا بشكل استثنائي في تفسير القصد باللغة العربية بينما كانت تعاني من الهياكل النحوية التي غالبًا ما تحمل أهمية قانونية وتشغيلية. وصف الباحثون هذا الانفصال بأنه “انعكاس نحوي-براغماتي” – وهو الوضع الذي يفهم فيه النموذج ما تحاول الجملة إيصاله على نطاق واسع ولكنه يسيء تفسير الآليات التي تحدد معناها الدقيق.

وفي المحادثات غير الرسمية، قد لا يهم هذا التمييز. في عقد الشراء أو وثيقة الامتثال أو الإيداع التنظيمي أو الاتفاقية المالية المتوافقة مع الشريعة الإسلامية، يمكن أن يغير تفسير النص بشكل جوهري.

التحدي لا يكمن في أن الذكاء الاصطناعي العربي يبدو غير طبيعي. بل على العكس تماما. تولد نماذج اليوم لغة عربية مصقولة ومتماسكة، والتي غالباً ما تخفي الأخطاء البنيوية تحت السطح. تبدو النتائج جديرة بالثقة، مما يجعل اكتشاف الأخطاء أكثر صعوبة وربما أكثر خطورة.

قبل أن يتمكن الذكاء الاصطناعي من التفكير، عليه أن يقرأ

يصبح التحدي أكبر عندما تنتقل المؤسسات إلى ما هو أبعد من النص الرقمي النظيف إلى واقع بيانات المؤسسة.

عبر القطاعات الحكومية والمصرفية والرعاية الصحية والقانونية، تعمل المؤسسات على عقود من المستندات التي لم يتم تصميمها أبدًا للمعالجة الآلية. العقود الممسوحة ضوئيًا بجودة صورة متدهورة. النماذج المكتوبة بخط اليد. ملفات PDF القديمة التي تجمع بين اللغتين العربية والإنجليزية في نفس المستند. السجلات المالية حيث تتدفق الأرقام من اليسار إلى اليمين ضمن الفقرات التي تتدفق من اليمين إلى اليسار.

وتكافح أدوات الذكاء الاصطناعي ذات الأغراض العامة لمعالجة هذه المواد بشكل متسق.

لا يزال التعرف الضوئي على الحروف العربية (OCR) يمثل تحديًا كبيرًا على مستوى المؤسسات. النص العربي مخطوط بطبيعته، حيث يتغير شكل الحروف حسب موقعها داخل الكلمة. أضف إلى ذلك غياب علامات التشكيل، والاختلافات في المصطلحات الإقليمية، والخلط الروتيني بين اللغتين العربية والإنجليزية في بيئات الأعمال، وسرعان ما يزداد التعقيد.

توصلت مائدة مستديرة أكاديمية نظمها برنامج الشريعة الإسلامية بكلية الحقوق بجامعة هارفارد في عام 2025 إلى أن تحويل التعرف الضوئي على الحروف للوثائق العربية الفصحى والرسمية غالبًا ما يؤدي إلى دقة منخفضة وأن الرقمنة وحدها لا تجعل المستندات قابلة للقراءة آليًا بشكل موثوق.

بالنسبة للعديد من المؤسسات، لا يعد نموذج الذكاء الاصطناعي بحد ذاته المصدر الرئيسي للمخاطر. تبدأ المشكلة غالبًا في وقت مبكر من سير العمل.

إذا تمت رقمنة العقود أو السجلات أو النماذج بشكل غير صحيح، فحتى النموذج الأكثر تقدمًا يولد إجابات بناءً على مدخلات معيبة. والنتيجة هي وهم خطير بشأن الدقة: يبدو الذكاء الاصطناعي واثقًا لأنه لا يدرك أن المادة المصدر قد أسيء قراءتها في المقام الأول.

وهنا تفشل العديد من عمليات نشر الذكاء الاصطناعي باللغة العربية ــ وغالبا ما تفعل ذلك بصمت. وينتج النظام استجابات بطلاقة لأنه تم تدريبه لتوليد الإجابات، وليس التعرف عندما تكون البيانات الأساسية غير موثوقة. ثم تنتشر الأخطاء إلى ملخصات، وتوصيات، وقرارات، وسير العمل الآلي.

بنيت للإجابة، وليس لمعرفة متى تتوقف

تم تصميم نماذج اللغة الكبيرة لإنتاج مخرجات. وعندما يُطلب منهم ذلك، يقومون بإنتاج إجابات بثقة وطلاقة ومطولة، بغض النظر عما إذا كانت الإجابة صحيحة أم لا.

يمكن أن يكون الشرط الذي تم تفسيره بشكل خاطئ في ملخص العقد أكثر خطورة من خطأ الترجمة الواضح لأنه لا توجد علامات تحذيرية مرئية تتطلب المراجعة البشرية.

وجدت الأبحاث المقدمة في مؤتمر معالجة اللغة الطبيعية العربية لعام 2025 أن الهلوسة الواقعية – وهي مخرجات بطلاقة ولكن ملفقة – كانت أكثر شيوعًا من أخطاء الإخلاص عبر النماذج التي تم تقييمها. لقد أصبحت هذه القضية مهمة بما فيه الكفاية بحيث توجد الآن معايير وأطر تقييم مخصصة لقياس الهلوسة في المحتوى العربي والإسلامي.

إن إنشاء موقع IslamEval 2025، وهو أول مهمة مشتركة تركز على اكتشاف الهلوسة في المحتوى الإسلامي، يعكس اعترافًا متزايدًا بأن هذه الإخفاقات لم تعد نظرية. تواجه المؤسسات بالفعل هذه المشكلات في بيئات الإنتاج.

بالنسبة للمديرين التنفيذيين الذين يقومون بتقييم عمليات نشر الذكاء الاصطناعي، فإن هذا التطور يغير المحادثة. لم يعد السؤال هو ما إذا كان النموذج يمكنه توليد اللغة العربية. يمكن لمعظم النماذج الحديثة.

والسؤال الأهم هو ما إذا كان النظام يعرف متى لا يعرف.

في البيئات الحكومية والمؤسساتية والقانونية والتنظيمية، لا تعد الاستجابة الصحيحة إجابة دائمًا. في بعض الأحيان يكون هناك عدم يقين أو تصعيد أو طلب مراجعة بشرية. ومع ذلك، فإن نماذج اللغة يتم تحسينها بطبيعتها لتوفير الاستجابة.

ولابد من هندسة هذه الفجوة السلوكية من خلال أطر الحوكمة، والسياسات السريعة، والإشراف البشري، وهياكل النشر التي تعطي الأولوية للموثوقية على حجم الإنتاج.

حالة الذكاء الاصطناعي العربي المبني لهذا الغرض

كشف معيار ALPS أن النماذج العربية المصممة لهذا الغرض تفوقت على بعض النماذج الحدودية في مجالات مثل الافتراضات المسبقة وتحليل الخطاب – وهي المهام التي يكون فيها التعقيد البنيوي للغة العربية أكثر أهمية.

تسلط هذه النتيجة الضوء على حقيقة مهمة: إن الطريق إلى الذكاء الاصطناعي العربي الموثوق به لا يقتصر ببساطة على نشر نماذج أكبر.

يتطلب اختيارات معمارية متعمدة.

يتضمن ذلك بيانات التدريب التي تعكس الاستخدام الحقيقي للغة العربية بدلاً من المحتوى الإنجليزي المترجم. ويتطلب التعرف الضوئي على الحروف وأنظمة معالجة المستندات المصممة خصيصًا لهياكل المستندات العربية. وهو يستفيد من النماذج الخاصة بالمجال التي تم ضبطها لسير العمل القانوني أو التنظيمي أو الرعاية الصحية أو المالية. كما يعتمد أيضًا على حواجز الحماية التي تقيد ميل النموذج إلى توليد مخرجات تتجاوز نطاق اختصاصه الذي تم التحقق منه.

إن المنظمات التي تحقق أقوى النتائج اليوم لا تستخدم بالضرورة النماذج الأكبر. إنهم يبنون أنظمة ذكاء اصطناعي منضبطة مصممة حول حالات استخدام محددة بوضوح.

يتضمن ذلك عادةً أربعة عناصر:

خطوط معالجة المستندات العربية الأولى التي يمكنها رقمنة بيانات المؤسسة وتنظيمها بدقة قبل أن تصل إلى النموذج.

مجموعات بيانات التدريب التي تعكس الاستخدام العربي الأصيل عبر القطاعات والمناطق الجغرافية.

تركز عمليات النشر الخاصة بالمجال على مسارات عمل تشغيلية محددة بوضوح.

آليات الحكم وحواجز الحماية التي تقلل من الهلوسة وتقييد التكاثر الزائد.

غالبًا ما يوفر هذا النهج دقة أعلى مع تقليل النفقات الحسابية والمخاطر التشغيلية.

من يملك معيار الثقة؟

تقوم المملكة العربية السعودية بواحدة من أكثر الاستثمارات طموحًا في العالم في مجال الذكاء الاصطناعي، والتي تشمل البنية التحتية، وتنمية المواهب، والتنظيم، والتبني. ويتمثل التحدي التالي في ضمان إمكانية الثقة بهذه الأنظمة باللغة العربية، على نطاق واسع، عبر المؤسسات العامة والخاصة.

يمكن لمجموعات التكنولوجيا التي تجمع بين معالجة البيانات العربية المتقدمة والحوكمة الخاصة بالمجال وإدارة البيانات الآمنة ونماذج اللغات المحلية والدولية المختارة بعناية أن تعالج العديد من تحديات اليوم. والأهم من ذلك، أنها تساعد المؤسسات في الحفاظ على الرقابة على النتائج وإنشاء الانضباط التشغيلي اللازم لاعتماد الذكاء الاصطناعي على المدى الطويل.

لقد حل الذكاء الاصطناعي التوليدي إلى حد كبير مشكلة إنتاج اللغة العربية بطلاقة.

وما يبقى دون حل هو شيء أكثر أهمية بكثير: الثقة.

وفي البيئات ذات العواقب العالية، لن تأتي الميزة التنافسية من توليد المزيد من الكلمات. سيأتي من معرفة متى يمكن الاعتماد على هذه الكلمات.