بيان صحفي:
أعلنت شركة Arabi.AI، الشركة الرائدة إقليمياً في مجال الذكاء الاصطناعي وتكنولوجيا المؤسسات باللغة العربية، عن إطلاق مشروع HELM Arab Enterprise بالتعاون مع مركز جامعة ستانفورد لأبحاث النماذج الأساسية (CRFM). تم تصميم هذه المبادرة لتعزيز كيفية تقييم المؤسسات لنماذج اللغة العربية الكبيرة (LLMs) للاستخدام المؤسسي
يُعرف CRFM في جامعة ستانفورد بإنشاء إطار عمل HELM (التقييم الشامل لنماذج اللغة)، والذي وضع معيارًا عالميًا لتقييم النماذج الشفافة والقابلة للتكرار. وبناءً على هذا الأساس، تقدم HELM Arab Enterprise معيارًا منظمًا يمنح النظام البيئي العربي للذكاء الاصطناعي مرجعًا عمليًا ومشتركًا لمقارنة سلوك النماذج ودعم ممارسات التقييم الأكثر اتساقًا.
تقوم شركة HELM Arab Enterprise بتقييم النماذج عبر ست مهام تركز على المؤسسة والتي تشمل إنشاء المحتوى، والتفكير المالي، والإجابة على الأسئلة القانونية. تم تصميم هذا المعيار لقياس مدى موثوقية أداء حاملي شهادات LLM العربية في حالات الاستخدام المهني والمؤسسي، وخاصة في البيئات المنظمة. كما هو الحال مع جميع معايير HELM، تكون المطالبات والاستجابات والمقاييس والنتائج شفافة وقابلة للتكرار من خلال إطار عمل HELM مفتوح المصدر.
بالنسبة لـArabic.AI، يتماشى التعاون مع هدفها طويل المدى المتمثل في تطوير الذكاء الاصطناعي باللغة العربية أولاً مع المساهمة بأدوات مفيدة لمجتمع البحث والمؤسسات الأوسع. يوفر إصدار HELM Arab Enterprise للفرق أساسًا مشتركًا يمكنهم استخدامه للتقييم الداخلي ومقارنة البائعين ومراقبة النماذج المستمرة. وينظر Arab.AI وCRFM في جامعة ستانفورد إلى هذا باعتباره خطوة مهمة نحو بنية تحتية أكثر نضجًا للذكاء الاصطناعي للمؤسسات العربية.
وقالت نور الحسن، الرئيس التنفيذي لشركة Arab.AI: “يحتاج الذكاء الاصطناعي في المؤسسات العربية إلى إطار تقييم صارم ومنفتح ومرتبط بشكل مباشر بسير العمل الحقيقي في الأعمال”. “تمنح شركة HELM Arab Enterprise النظام البيئي معيارًا مشتركًا لقياس التقدم والموثوقية بوضوح وثقة.”





