مقدمة

في خطوة مثيرة نحو تطوير أدوات الذكاء الاصطناعي، أظهر باحثو شركة Anthropic كيف تمكنوا من استخدام 16 نموذجًا من نموذج Claude Opus 4.6 لإنشاء مترجم C جديد. رغم النجاح الظاهر، تظهر هناك تحديات كبيرة تتطلب إدارة بشرية عميقة.

تفاصيل التجربة

قام الباحث نيكولاس كارليني بنشر مدونة توضح كيف تم تكليف الوكلاء بإنشاء مترجم C من الصفر باستخدام قاعدة بيانات مشتركة. خلال أسبوعين تقريبًا ونحو 2000 جلسة برمجية، كلفت التجربة حوالي 20,000 دولار في رسوم API. وأنتج الوكلاء مترجمًا مكونًا من 100,000 سطر بلغة Rust، قادرًا على بناء نواة Linux 6.9 على معماريات x86 وARM وRISC-V.

آلية العمل

كل نموذج Claude عمل داخل حاوية Docker خاصة به، حيث قاموا بتكرار مستودع Git مشترك، وكتبوا ملفات قفل لتأكيد المهام، ثم دفعوا الكود المكتمل. لم يكن هناك وكيل تنسيق يدير حركة المرور، حيث عمل كل نموذج بشكل مستقل على تحديد المشكلات الأكثر وضوحًا وحلها. وعند حدوث تعارضات في الدمج، تمكنت النماذج من حلها بنفسها.

نتائج التجربة

المترجم الناتج، الذي تم إصداره على GitHub، يمكنه تجميع مجموعة من المشاريع الكبرى مفتوحة المصدر مثل PostgreSQL وSQLite وRedis وFFmpeg. وقد حقق 99% من النجاح في اختبار GCC، واستطاع تشغيل لعبة Doom، مما يعتبر اختبارًا نهائيًا للمطورين.

قيود المشروع

على الرغم من الإنجاز، أقر كارليني بوجود قيود واضحة. حيث يفتقر المترجم إلى دعم 16 بت x86 اللازم لتشغيل Linux من وضع الذاكرة الحقيقي، ويستخدم GCC لهذه الخطوة. كما أن المترجم يعاني من أخطاء في التجميع والربط، وإنتاجيته أقل مقارنةً بـ GCC.

التحديات البشرية

أشار كارليني إلى أن العمل البشري كان ضروريًا لتصميم البيئة المحيطة بالنماذج. حيث قضى وقتًا كبيرًا في بناء أنظمة اختبار وقنوات تكامل مستمرة، وتوفير التغذية الراجعة التي تساعد النماذج على العمل بكفاءة. كما قام بتعديل كيفية إخراج نتائج الاختبارات لتقليل الضوضاء في سياق النموذج.

استنتاجات

رغم الإنجاز المثير، فإن هذه التجربة تبرز التحديات القائمة في تطوير نماذج البرمجة الذكية. بينما قد تكون النماذج قادرة على العمل بشكل شبه مستقل، فإن الإنجاز الفعلي يتطلب إشرافًا بشريًا مستمرًا. يظل استخدام الوكلاء المتعددين بالتنسيق مع Git مع إشراف بشري محدود فكرة مبتكرة قد تساهم في تطوير أدوات برمجية أكثر فعالية.

كما أقر كارليني بأن هذه النتائج غير متوقعة في هذا الوقت المبكر من عام 2026، مشيرًا إلى أهمية التحقق من البرمجيات التي يتم نشرها.