لقد شعر مستخدمو ChatGPT في الولايات المتحدة بالحيرة من الارتفاع الأخير في عدد ردود الذكاء الاصطناعي المكتوبة بشكل غامض باللغة العربية.
لقد فاجأت هذه الظاهرة العديد من الأمريكيين الناطقين باللغة الإنجليزية خلال الشهر الماضي، حيث شارك العديد منهم صورًا على وسائل التواصل الاجتماعي لإجابات تم إنشاؤها بواسطة الذكاء الاصطناعي وإضافة نص عربي بشكل عشوائي إلى محادثاتهم.
وكتب أحد الأشخاص على موقع Reddit: “لقد فعلت ذلك مرتين على هاتفي، ومرة على الكمبيوتر المحمول الخاص بالعمل، وأنا لست حتى في دولة ناطقة باللغة العربية”، موضحًا كيف بدأ برنامج الدردشة الشهير في تقديم مكونات الوصفات باللغة العربية قبل أسبوعين.
وأفاد آخرون أنه تم تغيير الأرقام أيضًا إلى اللغة العربية وأن الذكاء الاصطناعي بدأ في الاستجابة للمطالبات الإنجليزية باللغات الأرمنية والعبرية والإسبانية والصينية والروسية.
في حين ألقى البعض اللوم في هذا النص الغريب على هلوسة الذكاء الاصطناعي، عندما تنتج روبوتات الدردشة إجابات غير صحيحة في الواقع أو لا معنى لها على الإطلاق، يبدو أن المشكلة تنبع في الواقع من كيفية تدريب ChatGPT.
ChatGPT، والذي يُعرف أيضًا باسم نموذج اللغة الكبير (LLM)، لا يقرأ الكلمات كاملة بالطريقة التي يفعلها البشر، ولكنه يقسم النص إلى أجزاء صغيرة تسمى “الرموز”، والتي يمكن أن تكون أجزاء من الكلمات أو علامات الترقيم أو حتى كلمات قصيرة من لغات أخرى.
نظرًا لأن بعض الكلمات الأجنبية أقصر وأسهل على النظام في معالجتها، فقد يختارها النموذج أحيانًا إذا كانت تناسب السياق وتتطلب عددًا أقل من الرموز المميزة.
هذا لا يعني أن الذكاء الاصطناعي يقوم بتبديل اللغات عن قصد، ولكنه ببساطة يختار الجزء التالي الأكثر احتمالاً من النص بناءً على الاحتمالية.
نشر مستخدمو ChatGPT صورًا للردود توضح كيف تم استبدال الكلمات الإنجليزية البسيطة بشكل عشوائي بأحرف من لغات مختلفة
أصبح ChatGPT من OpenAI يقدم بشكل متزايد للمستخدمين الناطقين باللغة الإنجليزية ردودًا باللغة العربية خلال الشهر الماضي (صورة مخزنة)
تم إنشاء ChatGPT، الذي يقال إنه يستخدمه ما يقرب من 900 مليون شخص شهريًا، بواسطة شركة الذكاء الاصطناعي OpenAI في عام 2022.
فهو يتيح للمستخدمين كتابة الأسئلة أو المطالبات باللغة العادية، ويجيب عليهم بنص يشبه الإنسان بشكل مدهش. لقد استخدمه الملايين لكتابة المقالات أو شرح المفاهيم أو إنشاء القصص أو ترجمة اللغات أو حل المشكلات أو مجرد الدردشة.
في حين تبعت العديد من روبوتات الدردشة المدعمة بالذكاء الاصطناعي، بما في ذلك Gemini من Google، وGrok من xAI، وAnthropic’s Claude، تواصل GPT السيطرة على السوق، حيث تسيطر على ما يقرب من ثلثي الصناعة المتنامية.
وقد عالجت OpenAI علنًا بعض مواطن الخلل المتعلقة باللغة، مع مشاكل مشابهة للاستجابات العربية الغريبة التي تم الإبلاغ عنها في عام 2024.
قبل عامين، أبلغ مستخدمو GPT عن حوادث واسعة النطاق لإنشاء “هراء”، والتي نتجت عن خطأ داخلي في تعيين الرمز المميز أثناء تحديث النموذج.
ومع ذلك، لم يتناول أي من إعلانات الشركة الأخيرة أخطاء خلط اللغة والاستجابات العربية غير المتوقعة للمطالبات باللغة الإنجليزية
لاحظ مستخدمو وسائل التواصل الاجتماعي الذين شاركوا هذه الردود الغامضة أن الكلمات في اللغات الأخرى لم تكن رطانة. في معظم الحالات، كان للكلمة في الواقع نفس معنى الكلمة الإنجليزية التي تم استبدالها.
ورد أحد مستخدمي موقع Reddit على صورة الوصفة موضحًا: “الكلمة تعني منخفض”. لذلك يبدو أنه يفتقد كلمة واحدة. ربما زبادي قليل الدسم.
تم إلقاء اللوم في المشكلة على الطريقة التي تم بها تدريب ChatGPT، باستخدام مليارات الكلمات من لغات متعددة (صورة مخزنة)
استجاب ChatGPT للعديد من المستخدمين الذين رأوا الكلمات العربية بشكل عشوائي بقولهم أنه تمت إضافة النص عن طريق الخطأ
لفهم سبب قيام ChatGPT بإرسال إجابات لعدد لا يحصى من المستخدمين باللغة العربية، من المفيد أن ننظر إلى ماهية “الرموز” في الواقع.
يمكن أن تتضمن الرموز المميزة التي تستخدمها روبوتات الدردشة المدعومة بالذكاء الاصطناعي كلمات كاملة (مثل “hello”) وأجزاء من الكلمات (مثل “un-” أو “-ing”) وعلامات الترقيم وعبارات أقصر باللغات الأجنبية.
على سبيل المثال، يمكن اعتبار كلمة “فهم” بمثابة ثلاثة رموز منفصلة في استجابة الذكاء الاصطناعي، مقسمة إلى “تحت” و”ستاند” و”جي”.
ولذلك سيبحث ChatGPT عن الطريقة الأكثر فعالية للإجابة على مطالبة الإنسان، وذلك باستخدام الكلمة أو العبارة التالية الأكثر منطقية لإكمال تفكيره بناءً على جميع البيانات التي تم تدريب chatbot عليها.
وكما رأى المستخدمون مؤخرًا، قد يقرر الذكاء الاصطناعي أن الطريقة الأكثر فعالية للإجابة على سؤال شخص ما هي كتابة رمز مميز واحد بدلاً من ثلاثة – حتى لو كان البديل كلمة عربية لا يفهمها المستخدم.
ومع ذلك، ادعى البعض دون دليل أن الأخطاء لم تكن عشوائية، قائلين إن الإصدارات السابقة من ChatGPT لم ترسل أبدًا إجابات مختلطة بكلمات بلغات أجنبية.
“هذه هي المرة الأولى التي أفعل فيها هذا، وأنا [have been using] الذكاء الاصطناعي لسنوات حتى الآن. قال أحد مستخدمي GPT المتأثرين: “لا يمكن أن يكون خطأً عشوائيًا”.
نشر شخص آخر على وسائل التواصل الاجتماعي أن ChatGPT ادعى أن كلمة عربية “تسللت” أثناء الرد.
“يا أخي، أنا أتحدث الإنجليزية. لماذا تردين باللغة العربية؟ نشر مستخدم GPT على X.
”لقد انزلقت عن طريق الخطأ.” انزلقت؟؟؟ إنها أبجدية مختلفة تمامًا





