تجربة أجرتها بي سي جي (مجموعة بوسطن الاستشارية) بدعم من كلية هارفارد للأعمال وكلية MIT Sloan للإدارة وكلية وارتون وجامعة بنسلفانيا وجامعة وارويك، أثبتت أن الذكاء الاصطناعي التوليدي سيكون ناقلًا قويًا للميزة التنافسية في السنوات القادمة للشركات التي تمكنت من استخدامه لمواجهة تحدياتها التشغيلية.
دراسة علمية متناقضة
في هذه التجربة العلمية الجديدة، ثبت أنه عند توليد الذكاء الاصطناعي (في هذه الحالة، جي بي تي -4 من OpenAI) يستخدم بالطريقة الصحيحة مع الاستشاريين، قدراتها كبيرة لدرجة أنها يمكن أن تنقلب عليهم أحيانًا. في الواقع، ليس من السهل دائمًا تحديد متى يكون الذكاء الاصطناعي (أو غير مناسب) لاحتياجاتك. علاوة على ذلك، يمكن أن يكون لهذا عواقب وخيمة. عند إساءة استخدامه، بالنسبة للمهام الخاطئة، يمكن أن يؤدي الذكاء الاصطناعي التوليدي إلى الكثير تدمير القيمة.
ومع ذلك، فإن إمكانية تحسين أدائها مذهلة بشكل عام. عند استخدام الذكاء الاصطناعي التوليدي لتصميم منتجات جديدة، فإن المهمة تشمل التفكير و إنشاء المحتوى، تقريبًا 90% من المشاركين قاموا بتحسين أدائهم. ما هو أكثر من ذلك، تقاربوا مستوى أداء أعلى بنسبة 40% إلى الأشخاص الذين يعملون في نفس المهمة بدون GPT-4.
أخيرًا، تصف الاستنتاجات مفارقة : يبدو أن الأشخاص الذين تمت مقابلتهم احذر من التكنولوجيا في المجالات التي يمكن أن توفر فيها قيمة مضافة كبيرة و تثق به كثيرًا في المناطق التي لا تتمتع فيها بالكفاءة. بالإضافة إلى ذلك، تُظهر الدراسة أن الإنتاج الموحد نسبيًا للذكاء الاصطناعي التوليدي يمكن تقليل تنوع الفكر في المجموعة بنسبة 41٪.
قد يختلف المدى الدقيق للتأثيرات التي تمت ملاحظتها بشكل مشروع في سياقات أخرى. لكن هذه النتائج تسلط الضوء لحظة حاسمة لاتخاذ القرار للمديرين من جميع قطاعات النشاط. إنهم بحاجة إلى التفكير بشكل نقدي حول العمل الذي تقوم به مؤسستهم والمهام التي يمكن أن تستفيد منها أو تعاني منها من الذكاء الاصطناعي التوليدي. هذا يعني الاقتراب من اعتماده كـ جهد إدارة التغيير تغطي البنية التحتية للبيانات والاختبارات الصارمة والتجريب وإصلاح استراتيجيات مصادر المواهب الحالية. ربما الأهم من ذلك، سيحتاج القادة إلى ذلك يعيدون تقييم قراراتهم باستمرار نظرًا لأنتتوسع حدود مهارات الذكاء الاصطناعي التوليدية.
قضية القيمة الحاسمة
تظهر نتائج الدراسة بوضوح ذلك اعتماد الذكاء الاصطناعي التوليدي هو سلاح ذو حدين. في الواقع، المشاركون الذين استخدموا GPT-4 لـ ابتكار المنتجات الإبداعية حصلت على نتائج أفضل بنسبة 40% لأولئك في المجموعة الضابطة (أولئك الذين أكملوا المهمة دون استخدام GPT-4). من ناحية أخرى، من أجل حل مشاكل الأعمال، أدى استخدام GPT-4 إلى دأداء أقل بنسبة 23% لأولئك الموجودين في المجموعة الضابطة.
تطلبت مهمة ابتكار المنتجات الإبداعية من المشاركين تطوير منتجات جديدة وخطط الذهاب إلى السوق. تطلبت مهمة حل مشكلات الأعمال من المشاركين تحديد الأسباب الجذرية لصعوبات الشركة بناءً على بيانات الأداء والمقابلات مع المديرين التنفيذيين. على عكس ما هو متوقع تمامًا، تميل نماذج الذكاء الاصطناعي التوليدية الحالية إلى أن تكون أكثر نجاحًا في النوع الأول من المهام. في الواقع، من السهل على LLMs التوصل إلى أفكار إبداعية أو جديدة أو مفيدة استنادًا إلى كميات هائلة من البيانات التي تم تدريبهم عليها. من ناحية أخرى، يكون هامش الخطأ أكبر عندما يتعلق الأمر بدراسة البيانات النوعية والكمية الدقيقة للإجابة على سؤال معقد.
والأمر الأكثر إثارة للدهشة هو أن العديد من المشاركين الذين استخدموا GPT-4 لهذه المهمة قبلوا النتائج الخاطئة للأداة. من المحتمل أن تكون قدرة GPT-4 على إنشاء محتوى مقنع قد ساهمت في هذه النتيجة. علاوة على ذلك، فإن العديد منهم لديهم أكدوا أنهم وجدوا التبرير الذي قدمته GPT-4 لنتائجها مقنعًا للغاية (على الرغم من أنه اقترح، بصفته ماجستير في القانون، الأساس المنطقي بعد التوصية، بدلاً من إنشاء التوصية على أساس الأساس المنطقي).
في أي سياق يجب استخدام الذكاء الاصطناعي التوليدي؟
الارتباط الوثيق بين الأداء والسياق الذي يتم فيه استخدام الذكاء الاصطناعي التوليدي يثير هذا سؤالًا مهمًا حول التدريب: هل يمكن التخفيف من مخاطر تدمير القيمة من خلال مساعدة الناس على فهم مدى ملاءمة التكنولوجيا لمهمة معينة؟ سيكون من المنطقي افتراض أنه إذا عرف المشاركون حدود GPT-4، سيعرفون عدم استخدامه، أو سيستخدمونه بشكل مختلف، في هذه الحالات.
ومع ذلك، فإن الآثار السلبية لـ GPT-4 على مهمة حل مشاكل الأعمال لم تختف عندما تلقى الأشخاص نظرة عامة على كيفية استخدام GPT-4 والقيود المفروضة على التكنولوجيا.
والأمر الأكثر إثارة للدهشة هو أن أداءهم كان أسوأ بكثير في المتوسط من أولئك الذين لم يتلقوا هذا التدريب البسيط قبل استخدام GPT-4 لنفس المهمة. يمكن أن تكشف هذه النتيجة المتناقضة الثقة المفرطة من قبل المشاركين في قدراتهم الخاصة على استخدام GPT-4، على وجه التحديد لأنهم تلقوا التدريب.