أفضل أداة توليد صور بالذكاء الاصطناعي؟.. “واشنطن بوست” تجيب

أجرت صحيفة واشنطن بوست اختبارًا شاملاً لتقييم كفاءة نماذج الذكاء الاصطناعي التوليدي في إنشاء الصور والاستجابة لطلبات المستخدمين، مع التركيز على النماذج المتاحة للجمهور دون الحاجة إلى خبرة تقنية متقدمة. يهدف هذا الاختبار إلى تحديد أفضل أداء بين هذه الأدوات المتنامية، والتي أصبحت شائعة بشكل متزايد في مجالات الإبداع والتصميم. وشملت الدراسة نماذج رائدة مثل Adobe Firefly و Bytedance Seedream Image 4.0 و Gemini 3 Pro و ChatGPT-5 و Meta AI.
ركزت التجربة، التي أعدها كل من جيفري فاولر وكيفن شاول، على تقييم قدرة هذه النماذج على تنفيذ مهام متنوعة، بدءًا من تعديل الصور الحالية وصولًا إلى توليد صور جديدة تمامًا بناءً على أوامر نصية معقدة. يأتي هذا التقييم في وقت يشهد فيه استخدام أدوات الذكاء الاصطناعي التوليدي نموًا سريعًا، مما يجعل فهم قدراتها وقيودها أمرًا بالغ الأهمية.
منهجية اختبار احترافية لتقييم الذكاء الاصطناعي التوليدي
اعتمدت الصحيفة على منهجية صارمة لضمان موضوعية النتائج. لم يقتصر التقييم على آراء المحررين التقنيين، بل تم الاستعانة بلجنة تحكيم مستقلة تضم خبراء في مجال التصوير الفوتوغرافي والفنون الرقمية. تهدف هذه اللجنة إلى تقييم جودة الصور المولدة، ودقتها، وواقعيتها، بناءً على معايير مهنية صارمة.
تضم لجنة التحكيم ديفيد كارسون، المصور الصحفي الحائز على جائزة بوليتزر، وداليا دريسر، الفنانة التشكيلية الرقمية، وبراتيك نايك، خبير تنقيح الصور. وقد قاموا بتقييم الصور المولدة بناءً على معايير فنية وجمالية محددة، مع التركيز على التفاصيل الدقيقة والقدرة على تحقيق الواقعية.
اختبارات متنوعة لتقييم القدرات
تضمن الاختبار خمسة سيناريوهات مختلفة لتقييم قدرات النماذج في مجالات متنوعة. شملت هذه السيناريوهات تعديل الوجوه، وتوليد صور فنية، وحذف أشخاص من الصور، وتوليد صور تعبر عن مشاعر معينة، وتوليد صور لأيدي بشرية في أوضاع معقدة. تم تصميم هذه الاختبارات لمحاكاة المهام التي قد يواجهها المستخدمون في حياتهم اليومية.
على سبيل المثال، تضمن أحد الاختبارات إضافة شعر إلى صورة الممثل دواين جونسون، بينما تطلب اختبار آخر توليد صورة غزال بألوان مبهرة بأسلوب فني. كما تضمن اختبار حذف شخص من صورة تجميعية للممثلتين كريستيان ستيورات وروبرت باتينسون، واختبار توليد صورة ممثل يبكي فرحًا لفوزه بجائزة الأوسكار.
نتائج الاختبار والحكم النهائي
أظهرت النتائج تفوق نموذج Gemini 3 Pro، المدعوم بتقنية Nano Banana Pro، في معظم الاختبارات. وقد أشاد به أعضاء لجنة التحكيم لقدرته على توليد صور عالية الجودة ودقيقة التفاصيل. أشار براتيك نايك إلى التقدم الملحوظ الذي حققه هذا النموذج في مجال توليد الصور.
تميز Gemini بشكل خاص في تعديل الصور، سواء من خلال إزالة الأشخاص أو إضافة عناصر جديدة. وقد أشاد كارسون بقدرة النموذج على إنتاج صور يصعب التمييز بينها وبين الصور الحقيقية. ومع ذلك، أثار كارسون مخاوف بشأن قدرة النموذج على حماية حقوق الملكية الفكرية، حيث استخدم ملامح الممثل ليوناردو دي كابريو في صورة كان من المفترض أن تصور ممثلًا آخر، وأضاف توقيعًا وهميًا ينسب حقوق الصورة إلى مصور حقيقي.
في المقابل، جاء نموذج Adobe Firefly في المرتبة الأخيرة، ويعزى ذلك إلى اعتماده على صور مفتوحة المصدر في التدريب، مما أدى إلى تقليل جودة المخرجات مقارنة بالمنافسين. أكدت دريسر أن الفن الناتج عن الذكاء الاصطناعي يحتاج إلى تدخل بشري لتحقيق مستوى أعلى من الإبداع والتميز.
لا يزال توليد صور الأيدي والأصابع يمثل تحديًا كبيرًا لنماذج الذكاء الاصطناعي. على الرغم من أن Gemini تفوق في إظهار العدد الصحيح من الأصابع، إلا أن الصور المولدة لا تزال تفتقر إلى الواقعية الكاملة.
من المتوقع أن تشهد تقنيات الذكاء الاصطناعي التوليدي تطورات مستمرة في الأشهر والسنوات القادمة. من المهم مراقبة التقدم في مجال حماية حقوق الملكية الفكرية، وتحسين جودة الصور المولدة، وتطوير أدوات أكثر سهولة في الاستخدام. ستكون التغطية المستمرة لهذه التطورات ضرورية لفهم تأثيرها على مجالات الإبداع والتصميم والمجتمع بشكل عام.





