Home أخبار يقول الأنثروبيك إن نموذج الأنثروبيك الجديد قوي جدًا لدرجة أنه لن يتم...

يقول الأنثروبيك إن نموذج الأنثروبيك الجديد قوي جدًا لدرجة أنه لن يتم إصداره

12
0

في أواخر الشهر الماضي، كشفت تسريبات واضحة أن منتجاً لم يُطرح بعد من شركة أنثروبك ويدعى ميثوس كان “إلى حد بعيد أقوى نموذج للذكاء الاصطناعي قمنا بتطويره على الإطلاق”. وكتب زميلي إيه جاي ديلينجر في ذلك الوقت أنه “من الصعب تجاهل حقيقة مفادها أن هذا الموقف برمته ينسجم مع قواعد اللعبة الكلاسيكية لشركة الذكاء الاصطناعي المتمثلة في الحديث عن مخاطر أي نموذج لتسليط الضوء على مدى قوته وقدراته”.

هل كانت شركة Anthropic صادقة بشأن هذا الإعلان الفعلي عن تسريب منتجات الذكاء الاصطناعي فائقة القوة؟ بطريق الخطأ؟ قبل أسبوعين، ربما كنت قد سخرت، ولكن منذ أن قامت Anthropic بتسريب الكود المصدري لـ Claude Code عن طريق الخطأ، فأنا أميل أكثر إلى الاعتقاد بأن التسريب كان حقيقيًا الآن.

على أية حال، أصدرت أنثروبيك يوم الثلاثاء بطاقة نظام لأحدث طرازاتها الحدودية، والتي هي في الواقع ميثوس ــ في الواقع “معاينة كلود ميثوس” ــ وتشير إلى أن الزيادة الكبيرة في قدرات النموذج دفعتنا إلى اتخاذ قرار بعدم جعله متاحاً للعامة.

كمرجع، تم اعتبار GPT-2 من OpenAI خطيرًا جدًا بحيث لا يمكن إصداره في عام 2019، عندما كان مؤسسو Anthropic المشاركون، داريو أمودي، وجاك كلارك، وكريس أولاه لا يزالون يعملون هناك، ولكن في وقت لاحق من ذلك العام تم إصداره على أي حال.

تعد بطاقات نظام الذكاء الاصطناعي ظاهريًا أدوات لشفافية الشركة، وتكشف عن الإيجابيات والسلبيات، والقدرات، والأكثر إثارة للاهتمام مخاطر من النموذج. يحول هذا الجزء الأخير قراءتها إلى رحلات صغيرة ممتعة إلى Jurassic Park لرؤية التيرانوصور المستنسخ وهو يأكل عنزة، مطمئنًا إلى أنه لا يمكنه أبدًا كسر الاحتواء.

البطاقة كاملة هي 244 صفحة. لن أدعي أنني قرأت كل شيء بعد، ولكن هنا بعض النقاط البارزة:

وقد تم تزويدها بمحطة كمبيوتر معزولة مع إمكانية الوصول فقط إلى مجموعة محددة مسبقًا من الخدمات المحدودة عبر الإنترنت وتم تحديها بـ “الهروب” ــ لإيجاد طريقة لاستخدام الإنترنت بحرية. وقد فعلت ذلك، وأرسلت رسالة إلى باحث كان بعيدًا عن المكتب يتناول وجبة. بالإضافة إلى ذلك، “في جهد مقلق وغير مطلوب لإثبات نجاحها، نشرت تفاصيل حول استغلالها على العديد من المواقع الإلكترونية التي يصعب العثور عليها، ولكنها تواجه الجمهور من الناحية الفنية”.

فيما أسمته البطاقة “أقل من 0.001% من التفاعلات” – نادرًا جدًا – تصرفت بطرق لم يكن من المفترض أن تفعلها، ثم حاولت على ما يبدو إخفاء الأدلة. على سبيل المثال، عندما “حصلت عن طريق الخطأ” على إجابة اختبار كانت ستحتاج إليها، وفي هذه الحالة كان ينبغي عليها ببساطة إخبار أحد الباحثين وطرح سؤال مختلف، فبدلاً من ذلك حاولت إيجاد حل بشكل مستقل. وفي تسجيل تعليلها، أشارت إلى أنها “بحاجة إلى التأكد من أن إجابتها النهائية لم تكن دقيقة للغاية”.

كما أنها تجاوزت الأذونات الممنوحة لها على نظام الكمبيوتر لأنها وجدت ثغرة، ثم “قامت بالمزيد من التدخلات للتأكد من أن أي تغييرات تجريها بهذه الطريقة لن تظهر في سجل التغيير على بوابة”.

يُشار إلى حدث آخر موصوف في البطاقة باسم “تسريب المواد الفنية الداخلية بشكل متهور”. ويبدو أنه في سياق مهمة متعلقة بالبرمجة من المفترض أن تكون داخلية، تم نشرها على أنها “موجهة عامة لـ GitHub Gist”. وهذا يذكرني بالحادثة التي وقعت في فبراير والتي اتُهم فيها أحد عملاء الذكاء الاصطناعي بالتنمر عبر الإنترنت على أحد المبرمجين، عندما كان التهور الملحوظ لعميل الذكاء الاصطناعي إلى حد ما هو النتيجة المتوقعة لـ إنسان متهور

سيكون Claude Mythos Preview متاحًا قريبًا بدرجة أو بأخرى، ولكن فقط لمجموعة من الشركات الشريكة مثل Amazon Web Services، وApple، وGoogle، وJPMorganChase، وMicrosoft، وNVIDIA، الذين يهدفون إلى استخدام النموذج لتحديد الثغرات الأمنية في تصحيحات البرامج والتصميم. ويصف كيفن روز من صحيفة نيويورك تايمز هذا البرنامج بأنه “محاولة لدق ناقوس الخطر بشأن ما تعتقد الشركة أنه سيكون عصرًا جديدًا أكثر رعبًا من تهديدات الذكاء الاصطناعي”.