Home عربي داخل سعي دولة الإمارات العربية المتحدة لبناء ذكاء اصطناعي يفكر باللغة العربية

داخل سعي دولة الإمارات العربية المتحدة لبناء ذكاء اصطناعي يفكر باللغة العربية

8
0

<!–

–>

بينما يستثمر الشرق الأوسط المليارات لتوسيع الذكاء الاصطناعي البنية التحتية، وتطوير الخدمات المدعمة بالذكاء الاصطناعي، وبناء أنظمة ذكاء اصطناعي قوية، يطرح سؤال مهم: ماذا يحدث إذا لم يفهم الذكاء الاصطناعي الأشخاص الذين يتفاعل معهم حقًا؟

يشكل هذا السؤال أهمية خاصة بالنسبة للعالم الناطق باللغة العربية، والذي يضم أكثر من 450 مليون شخص في أكثر من عشرين دولة.

على الرغم من كون اللغة العربية واحدة من أكثر اللغات انتشارًا في العالم، إلا أنها لا تزال ممثلة تمثيلاً ناقصًا بشكل كبير في تطوير الذكاء الاصطناعي العالمي. تشير الأبحاث إلى أن اللغة العربية تمثل أقل من 0.5% من مجموعات بيانات الذكاء الاصطناعي في جميع أنحاء العالم، مما يخلق فجوة تكنولوجية وثقافية عميقة.

ويقود الجهود الرامية إلى معالجة هذه الفجوة معهد الابتكار التكنولوجي في دولة الإمارات العربية المتحدة. تتحدى نماذج فالكون العربية الأصلية الافتراضات السائدة حول كيفية بناء لغة الذكاء الاصطناعي. في محادثة حديثة مع معهد ماساتشوستس للتكنولوجيا سلون مانجمنت ريفيو الشرق الأوسط، يوضح الدكتور حكيم حسيد، كبير الباحثين في مركز أبحاث الذكاء الاصطناعي والعلوم الرقمية بمعهد دراسات الترجمة، رؤية للذكاء الاصطناعي تقدر الأصالة الثقافية، وإمكانية الوصول، والانفتاح، والفوائد العملية على صنع نماذج أكبر.

لماذا يجب على الذكاء الاصطناعي العربي أن يفكر بشكل أصلي؟

بالنسبة للدكتور حامد، فإن المشكلة مع العديد من أنظمة الذكاء الاصطناعي الحالية متعددة اللغات لا تكمن في الأداء اللغوي فحسب؛ إنها فلسفة.

يقول: “إن العارضة التي تتحدث العربية بينما تفكر باللغة الإنجليزية ليس هو الشيء الصحيح الذي ينبغي عمله”.

يتم تدريب العديد من أنظمة الذكاء الاصطناعي اليوم بشكل أساسي على البيانات الإنجليزية، والتي يتم ترجمتها بعد ذلك إلى لغات أخرى. على الرغم من أن هذا النهج فعال، فإنه غالبًا ما يزيل الفروق الثقافية الدقيقة، والسياق التاريخي، والتفاصيل الاجتماعية الكامنة في تعبيرات اللغة الأم.

تعتبر اللغة العربية أكثر تحديًا لأنها ليست لغة واحدة فقط. بالإضافة إلى اللغة العربية الفصحى الحديثة، هناك العديد من اللهجات الإقليمية والعبارات المحلية والتعبيرات الثقافية الفريدة التي تختلف في جميع أنحاء العالم العربي.

ويقول الدكتور حامد: “إن اللهجات تنقل جوانب ثقافية تتعلق بمجموعات سكانية معينة”. “عندما تبدأ في الترجمة، فإنك تفقد تلك الخصوصيات.”

وقد وجهت طريقة التفكير هذه عملية إنشاء Falcon H1 باللغة العربية، وهو أول نموذج لغوي كبير لمعهد دراسات الترجمة تم تصميمه للتفكير باللغة العربية منذ البداية، بدلاً من مجرد الترجمة من الإنجليزية.

بالنسبة لمعهد دراسات الترجمة، لم يكن الحفاظ على السياق الثقافي مجرد تحسين تجربة المستخدم. كان الأمر يتعلق بضمان تفاعل المتحدثين باللغة العربية مع أنظمة الذكاء الاصطناعي التي يمكنها فهم واقعهم بمصطلحاتهم اللغوية الخاصة.

التحدي التقني لبناء الذكاء الاصطناعي العربي

ومع ذلك، فإن بناء مثل هذه الأنظمة يتطلب التغلب على العوائق الهيكلية والتقنية الرئيسية.

وكانت ندرة البيانات واحدة من أكبر العقبات. على الرغم من أن مئات الملايين من الأشخاص حول العالم يتحدثون اللغة العربية، إلا أن المحتوى الرقمي العربي عالي الجودة يظل محدودًا مقارنة بالمحتوى باللغة الإنجليزية المتاح عبر الإنترنت.

ويقول الدكتور حامد: “إن التحدي لا يكمن فقط في كمية البيانات”. “إنها جودة البيانات.”

ولمعالجة هذه المشكلة، استثمر معهد دراسات الترجمة في تطوير مجموعات بيانات باللغة العربية الأصلية عالية الجودة بدلاً من الاعتماد على المحتوى المترجم. كما أنشأ المعهد خطوطًا لزيادة البيانات لتوسيع المواد باللغة العربية مع الحفاظ على الأصالة اللغوية.

لقد تجاوزت TII النماذج المعتادة للمحولات فقط، والتي قال الدكتور حامد إنها تعاني من الكفاءة والتعامل مع تسلسلات طويلة من المعلومات. يستخدم Falcon H1 مزيجًا من المحولات ونماذج مساحة الحالة، مما يساعده على معالجة النصوص الأطول واستخدام طاقة حاسوبية أقل.

والنتيجة هي نموذج قادر على التفكير بشكل أعمق، وتحسين الفهم السياقي، والأداء الأكثر كفاءة في الوقت الحقيقي، كل ذلك أثناء العمل ضمن التعقيد اللغوي للغة العربية.

يجب أن يكون اعتماد الذكاء الاصطناعي مدفوعًا بحالات الاستخدام الحقيقي

في حين أن الكثير من صناعة الذكاء الاصطناعي العالمية لا تزال تركز على بناء نماذج أكبر من أي وقت مضى، يعتقد الدكتور حامد أن المرحلة التالية من تطوير الذكاء الاصطناعي يجب أن تتحول نحو التطبيق العملي والقيمة التجارية.

يقول: “أحد الأشياء التي قام بها المجتمع في مجال الذكاء الاصطناعي هو أن الجميع اندفعوا لبناء هذه النماذج”. “ثم سألنا أنفسنا ماذا نفعل بهم لاحقًا.”

ويقول إن هذا التراجع أصبح أحد التحديات المميزة لهذه الصناعة. على الرغم من أن تطبيقات الذكاء الاصطناعي للمحادثة قد أثارت حماسًا هائلاً، إلا أن المؤسسات تتعرض الآن لضغوط لإظهار تأثير مؤسسي ذي معنى وعائد على الاستثمار.

يعتقد الدكتور حامد أن مستقبل الذكاء الاصطناعي يكمن في حل المشكلات الحقيقية في مجالات الرعاية الصحية والنقل والأمن والقانون والصناعة، وليس فقط في إنشاء روبوتات محادثة أفضل.

يقول: “التبني ليس خطوة سهلة”. “بعد هذه الضجة، يعد جلب الذكاء الاصطناعي إلى الأعمال تحديًا كبيرًا.”

ويمتد هذا التركيز على المنفعة أيضًا إلى الاستدامة. يتساءل الدكتور حامد عما إذا كانت الأساليب الحالية لتدريب نماذج الذكاء الاصطناعي الضخمة تظل قابلة للتطبيق على المدى الطويل، نظرًا للموارد الحسابية الهائلة واستهلاك الطاقة المتضمنة.

ويقول: “هناك حاجة إلى إعادة التفكير في المبادئ والمنهجيات الأساسية”. “ربما نفتقد شيئًا ما في مكان ما.”

المصدر المفتوح: استراتيجية ومسؤولية

يتمثل جزء أساسي من استراتيجية الذكاء الاصطناعي بمعهد دراسات الترجمة في التزامه بتطوير المصادر المفتوحة، وهو ما يراه الدكتور حامد خطوة ذكية ومسألة مبدأ.

عندما تم إتاحة برنامج Falcon للجمهور لأول مرة، وضعت دولة الإمارات العربية المتحدة بين أوائل الدول التي شاركت نماذج لغوية متقدمة. أكثر من مجرد جذب الاهتمام العالمي، يعتقد الدكتور حامد أن الانفتاح هو المفتاح لبناء الثقة في الذكاء الاصطناعي.

ويقول: “يجب أن يكون الذكاء الاصطناعي بطريقة أو بأخرى حقًا للناس في استخدامه”. “ولكي يستخدمونه، عليهم أن يفهموا ما بداخله”.

مع استمرار تزايد المخاوف العامة بشأن خصوصية البيانات والتحيز والهلوسة والسلامة، توفر النماذج مفتوحة المصدر قدرًا أكبر من الشفافية والرقابة المجتمعية مقارنة بالأنظمة المغلقة.

يعترف الدكتور حامد بأن الهلوسة والتحيز لا تزال مشاكل لم يتم حلها عبر صناعة الذكاء الاصطناعي. في حين يعتقد بعض الباحثين أن مجموعات البيانات الأكبر يمكن أن تقلل هذه المشكلات تدريجيًا، يرى آخرون أنها جزء لا يتجزأ من البنى الاحتمالية الحالية.

وجهة نظره تقع في مكان ما بينهما. ويوضح أن أنظمة الذكاء الاصطناعي الخاصة بمجال معين يمكن أن تقلل بشكل كبير من الهلوسة من خلال الجمع بين النماذج وهياكل المعرفة الخارجية والبيئات التي يتم التحكم فيها بإحكام.

ومع ذلك، فإن حل هذه القيود بشكل كامل قد يتطلب في نهاية المطاف تصميمات جديدة تمامًا للذكاء الاصطناعي مبنية على أطر تفكير أكثر حتمية.

الخطوة التالية: ذكاء اصطناعي أصغر حجمًا وأكثر سهولة في الوصول إليه

يعتقد الدكتور حامد أن اعتماد الذكاء الاصطناعي وإمكانية الوصول إليه سيحدد المرحلة الرئيسية التالية في الصناعة.

لا تستطيع كل مؤسسة أو فرد تحمل تكاليف البنية التحتية الضخمة لوحدة معالجة الرسومات المطلوبة لتشغيل أنظمة الذكاء الاصطناعي الحدودية. ونتيجة لذلك، تركز شركة TII بشكل متزايد على بناء نماذج مدمجة عالية الكفاءة قادرة على العمل على أجهزة الكمبيوتر المحمولة، والهواتف المحمولة، وحتى أجهزة إنترنت الأشياء.

ومن بين هذه الجهود، Falcon Tiny، وهو نموذج خفيف الوزن يحتوي على أقل من 100 مليون معلمة، وهو مصمم للقيام بمهام متخصصة باستخدام الحد الأدنى من البنية التحتية.

ويقول الدكتور حامد: “لا ينبغي النظر إلى النماذج على الجانب الأكبر فقط”. “إنهم بحاجة أيضًا إلى الوجود على الجانب الصغير”.

وتظهر هذه الرؤية النهج الأوسع الذي تتبعه دولة الإمارات العربية المتحدة في مجال الذكاء الاصطناعي، والذي لا يركز فقط على كونها الأكبر، ولكن أيضًا على جعل الذكاء الاصطناعي سهل الوصول إليه وملائمًا ثقافيًا ومفيدًا، مع الاحتفاظ بالسيطرة على التكنولوجيا الخاصة بها.

وفي عالم يهتم فيه الذكاء الاصطناعي في كثير من الأحيان بالسرعة والإنجازات الكبيرة، يمكن أن يصبح هذا النهج المختلف أحد أهم مساهمات المنطقة في مستقبل الذكاء الاصطناعي.