تمتص منظمة العفو الدولية صنع صور قطط رائعة ، ومن الواضح أنها تفتقد إلى نقطة الإنترنت بالكامل

Send

حاول الذكاء الاصطناعي (AI) مؤخرًا إنشاء صور قط من الصفر ، وكانت النتائج تنموية عن القطط.

يمكن لهذه الشبكة العصبية الخاصة (نوع من الذكاء الاصطناعي على غرار عمل الدماغ البشري) إنتاج صور أصلية واقعية بشكل مدهش للوجوه البشرية. في الواقع ، كان من المستحيل تقريبًا تمييز صور هؤلاء الأشخاص المختلفين عن المشاهدين البشريين عن صور الأشخاص الحقيقيين ، حسبما أفاد مبرمجو الذكاء الاصطناعي في دراسة تم نشرها في ديسمبر 2018 إلى مجلة arXiv ما قبل الطباعة.

ومع ذلك ، ثبت أن الماكر قصة أخرى. نفس الخوارزمية التي ولدت وجوه بشرية لا تشوبها شائبة خلقت قطط برؤوس مشوهة. العدد الخاطئ من العيون والساقين. والأجسام التي كانت طويلة جدًا أو قصيرة جدًا أو مستديرة بشكل غير عادي أو مستطيلة ، ومثنية بزاوية غريبة.

يُعرف محرك الذكاء الاصطناعي الذي أنتج صور القط المخيفة باسم "هندسة المولدات القائمة على النمط لشبكات الخصومة التوليدية" أو StyleGAN. وقالت الدراسة إن شبكات مثل هذه "عدائية" لأن نموذجين يعملان في وقت واحد: أحدهما يولد الصور ، والآخر يقيم النتائج مقابل الصور في مجموعة بيانات تدريبية ، بحيث تتعلم الشبكة من أخطائها وتحسن أدائها.

لكي ينتج الذكاء الاصطناعي صورًا بشرية نابضة بالحياة ، كان عليه أولاً أن "يتعلم" كيف تبدو الوجوه البشرية من الصور الموجودة. قسمت الخوارزمية الوجوه إلى قائمة تحقق من ميزات النمط ، مثل موضع الرأس ؛ جنس؛ لون البشرة؛ نسيج الشعر وأسلوبه ؛ وقال الباحثون وشكل العين والأنف والفم.

بمجرد أن تمكن StyleGAN من التعرف على كل هذه العناصر - دون إشراف بشري - تعلمت تجميعها بشكل مستقل لتوليد وجه بشري جديد تمامًا وواقعي. رفض الباحثون طلب إجراء مقابلة ، لكنهم شرحوا عمليتهم في مقطع فيديو تم نشره على Youtube في 12 ديسمبر 2018.

لذا ، لماذا لا تستطيع StyleGAN إنشاء صور قط واقعية بشكل رائع؟ قالت جانيل شين ، الباحثة التي تدرب الشبكات العصبية ولكنها لم تشارك في الخوارزمية ، أنها كانت تبذل قصارى جهدها مع ما كان عليها العمل معه - وعندما يتعلق الأمر بالقطط ، فإن آلاف الصور المرجعية التي استخدمتها كانت أقل من مثالية. الدراسة ، قال لعلم الحياة.

كتبت شين عن القطط الغريبة يوم 7 فبراير في مدونتها الذكاء الغرابة. على عكس مجموعة بيانات صور StyleGAN من الوجوه البشرية - التي تم فيها قطع الجثث والخلفيات ومواقف الرأس متشابهة مع بعضها البعض - اختلفت صور القطط في مجموعة البيانات بشكل كبير. تتضمن المجموعة لقطات مقرّبة ولقطات واسعة للقطط في مجموعة من الإعدادات وضد الخلفيات المختلفة. أظهرت بعض الصور قطة واحدة ، وبعضها شمل عدة قطط ، وبعضها الآخر شمل أشخاصًا أيضًا.

"هناك قطط مقلوبة ؛ هناك قطط ملتوية في كرة ؛ عيونهم مفتوحة ؛ عيونهم مغلقة. يمكنك بالتأكيد أن تقول أن بيانات الإدخال الخاصة بهم صاخبة قليلاً - وبصخب ، أعني أن هناك أشياء هناك قال شين "هذه ليست مجرد صورة لقط".

لذا ، لا تكن شديد الصعوبة على StyleGan بسبب الوحوش المرعبة للقطط المرعبة.

وأضاف شين: "هناك الكثير مما يجب أن تتعلمه الخوارزمية".

في حين أن البشر الواقعيين في StyleGAN كانوا بلا عيوب ، عانت الشبكة العصبية من تجميع القطط. (حقوق الصورة: Nvidia)

جعلت الإشارات البصرية المتضاربة من الصعب على StyleGAN معرفة كيف يفترض أن تبدو القطة الحقيقية. والشبكات العصبية لا تحتوي على سياق حقيقي للمعلومات التي تقدمها ؛ كل ما يعرفونه هو ما في مجموعات البيانات الخاصة بهم. تعلمت StyleGAN ما يكفي من الصور المرجعية لإعادة إنتاج التفاصيل الدقيقة والقوام بدقة ، مثل فراء القط أو شكل أذن القطط. لكن شين قال إن البرنامج عانى بوضوح في وضع القطة بأكملها معًا.

وقالت لـ "لايف ساينس": "الشبكة العصبية لا تفهم كيف تعمل القطط. ولا تفهم عدد أرجلها. ليس من الواضح حقًا عدد العيون التي تشاهدها أو مكان تشريحها".

شاهد المزيد من صور القطط المزعجة لـ StyleGAN ، والصور البشرية شبه المثالية وملفات المشاريع الأخرى على منصة التطوير GitHub.

Send