دراسة: ChatGPT يفشل في حل مشكلات البرمجة الحديثة ولا يمكنه استبدال البشر
كتبت/سها زكى
منذ أن تم الكشف عن ChatGPT في عام 2022، كان هناك الكثير من الحديث حول كيف يمكن لروبوت الدردشة المدعم بالذكاء الاصطناعي أن يحل محل البشر في بعض الوظائف، وفي حين يعتقد بعض خبراء التكنولوجيا أن روبوت الدردشة المدعم بالذكاء الاصطناعي سيتولى بعض الوظائف البشرية مثل البرمجة، يرى آخرون أن التكنولوجيا لا يمكن أن تكون أبدًا ذكية مثل البشر وستساعدهم فقط على أن يكونوا أفضل في عملهم.
كما قال بعض كبار الشخصيات في مجال التكنولوجيا في الماضي إنه بعد سنوات من الآن، لن تكون هناك حاجة للمبرمجين البشريين على الإطلاق لأن الذكاء الاصطناعي سيهتم بالبرمجة، ولكن هل هذا هو الحال فعلا؟ دراسة حديثة تقول ليس بالضرورة.
حيث أن البحث، الذي نشر في عدد يونيو من IEEE Transactions on Software Engineering، قارن التعليمات البرمجية التي أنتجها ChatGPT مع تلك المكتوبة من قبل المبرمجين البشريين، مع التركيز على الوظائف والتعقيد والأمان.
وقد وجدت الدراسة أن معدل نجاح ChatGPT في إنتاج التعليمات البرمجية الوظيفية يتباين بشكل كبير. اعتمادًا على صعوبة المهمة، ولغة البرمجة المستخدمة، وعوامل أخرى، تراوح نجاح الذكاء الاصطناعي من 0.66% إلى 89%.
ويشير هذا النطاق الواسع إلى أنه على الرغم من أن ChatGPT يمكنه أحيانًا مجاراة المبرمجين البشريين أو حتى تجاوزهم، إلا أنه يحتوي أيضًا على قيود كبيرة.
وأشار يوتيان تانغ، المحاضر في جامعة جلاسكو المشارك في الدراسة، إلى أن توليد الأكواد المستندة إلى الذكاء الاصطناعي يمكن أن يعزز الإنتاجية ويؤدي إلى أتمتة بعض مهام تطوير البرمجيات. ومع ذلك، من المهم فهم نقاط القوة والضعف في نماذج الذكاء الاصطناعي هذه، وأكد تانغ على الحاجة إلى تحليل شامل لتحديد المشكلات المحتملة وتحسين تقنيات التعليمات البرمجية المولدة بواسطة الذكاء الاصطناعي.
وللتعمق أكثر في هذه القيود، اختبر فريق البحث قدرة GPT-3.5 على حل 728 مشكلة ترميز من منصة LeetCode عبر خمس لغات برمجة: C، وC++، وJava، وJavaScript، وPython، وكشفت الدراسة أن ChatGPT كان بارعًا إلى حد ما في حل مشكلات الترميز قبل عام 2021 على LeetCode، حيث حقق معدلات نجاح تبلغ حوالي 89 بالمائة للمسائل السهلة، و71 بالمائة للمسائل المتوسطة، و40 بالمائة للمسائل الصعبة.
ومع ذلك، انخفض أداء الذكاء الاصطناعي بشكل ملحوظ عند التعامل مع مشكلات الترميز التي تم طرحها بعد عام 2021، على سبيل المثال، انخفض معدل نجاح ChatGPT للمسائل السهلة من 89 بالمائة إلى 52 بالمائة. بالنسبة للمسائل الصعبة، انخفض معدل النجاح من 40% إلى 0.66% فقط. يشير هذا إلى أن ChatGPT يعاني من مشاكل برمجية أحدث، ربما بسبب عدم تضمين بيانات التدريب الخاصة به هذه التحديات الأحدث.
اقترح تانغ فرضية معقولة للأداء المتغير لـ ChatGPT، واقترح أن يعمل الذكاء الاصطناعي بشكل أفضل مع مشاكل الخوارزمية قبل عام 2021 لأنه من المرجح أن يتم تضمين هذه المشكلات في مجموعة بيانات التدريب الخاصة به، ومع تطور البرمجة، لم يتعرض ChatGPT لمشاكل وحلول جديدة، حيث يفتقر إلى مهارات التفكير النقدي التي يتمتع بها المبرمج البشري.
ويعني هذا القيد أنه على الرغم من قدرة ChatGPT على معالجة المشكلات التي واجهتها سابقًا بشكل فعال، إلا أنه يواجه مشكلات أحدث وغير مألوفة.
تشير نتائج الدراسة إلى أنه على الرغم من أن نماذج الذكاء الاصطناعي مثل ChatGPT تحمل وعدًا بتعزيز الإنتاجية وأتمتة بعض مهام البرمجة، إلا أنها ليست بديلاً للمبرمجين البشريين بعد. إن عدم قدرة الذكاء الاصطناعي على حل مشكلات البرمجة الأحدث يسلط الضوء على الحاجة إلى التطوير والتدريب المستمر لمواكبة مجال هندسة البرمجيات المتطور باستمرار.
اقرأ أيضًا:
رفض الإبادة الممنهجة فى غزة ومساعى نقل الحرب لبلادنا
شكوك بين الديمقراطيين حول قدرة بايدن على هزيمة ترامب
إطلاق 5 ملايين رسالة إرشادية للمعتمرين عبر الشاشات الإلكترونية
الاحتلال لقطاع غزة والضفة الغربية والقدس
زيزو وفتوح يحصلان على راحة من تدريبات الزمالك بعد الانضمام للمنتخب
دكتور يوسف شلتوت اخصائي أمراض النساء والتوليد في حوار خاص للرأي العام المصري والإجابة عن أهم الأسئلة المتداولة
الصحة: فحص 5 ملايين و474 ألف طفل ضمن مبادرة رئيس الجمهورية للكشف المبكر وعلاج ضعف وفقدان السمع
نقدم لكم من خلال موقع (الرأى العام المصرى )، تغطية ورصدًا مستمرًّا على مدار الـ 24 ساعة لـ أسعار الذهب، أسعار اللحوم ، أسعار الدولار ، أسعار اليورو ، أسعار العملات ، أخبار الرياضة ، أخبار مصر، أخبار اقتصاد ، أخبار المحافظات ، أخبار السياسة، ويقوم فريقنا بمتابعة حصرية لجميع الأحداث الهامة و السياسة الخارجية والداخلية بالإضافة للنقل الحصري لـ أخبار الفن والعديد من الأنشطة الثقافية والأدبية.