۹ مشکل بزرگ هوش مصنوعی DALL-E

DALL-E

علیرغم اینکه DALL-E از زمان عرضه اولیه خود گام های مهمی برداشته است، هنوز کامل نیست. مولد هنر مشکلات متعددی دارد که نیاز به تعمیر دارند، که بسیاری از آنها با استفاده مکرر از آن آشکارتر می شوند. تناقضات و اندازه نادرست تنها چند مورد است.

1 هنوز نمی توان متن را درست دریافت کرد

در حالی که هوش مصنوعی نمی تواند متن را به خوبی در تصاویر بنویسد، من همچنان فکر می کنم – پس از آزمایش ده ها مولد هنر هوش مصنوعی – که DALL-E یکی از بدترین ها در این زمینه است. شما معمولاً با الزامات ساده موفقیت بیشتری خواهید داشت، اما همانطور که در زیر می بینید، نرم افزار هنوز برای نوشتن لهجه بر روی «کافه» مشکل داشت.
تصویر یک کافه تولید شده در DALL-E

در آزمایش‌های متعدد، DALL-E متن من را نیز غلط املایی کرده است – علی‌رغم اینکه من به نرم‌افزار اعلان‌های بسیار واضح دادم و چندین بار سعی کردم این مشکل را برطرف کنم. در موارد دیگر، متن تحریف شده است.

همچنین متوجه خواهید شد که DALL-E متن خوانایی برای تابلوهای خیابان و اشیاء مشابه ایجاد نمی کند.

 

2 وقتی از شما خواسته می شود اندازه تصاویر را تغییر نمی دهد

DALL-E نیاز به ایجاد یک تصویر را به خوبی درک می‌کند، اما وقتی از شما پرسیده می‌شود، تغییر اندازه آنها بسیار بد است. به عنوان مثال، من چندین بار از نرم افزار خواسته ام که اندازه تصاویر را برای وبلاگ های مختلف تغییر دهد. هر بار، DALL-E فقط تصویر را بازسازی می کند.

خوشبختانه، برش و تغییر اندازه تصاویر کاملاً ساده است. بسیاری از ابزارهای رایگان مانند Canva به شما این امکان را می دهند. با این وجود، انجام این کار بدون اتکا به نرم افزارهای شخص ثالث خوب خواهد بود.

3 در ایجاد تصاویر فوتورئالیستی ناموفق است

DALL-E مشکلات زیادی با عمق میدان ندارد، اما من فکر می‌کنم که در تولید تصاویر فوتورئالیستی بسیار بد است. به عنوان مثال، من ابتدا از هوش مصنوعی خواستم که تصویری از یک رتریور طلایی در کوه های زیر ایجاد کند (بدون اینکه بگویم چه نوع تصویری باید باشد).

تصویری از سگی در کوه که با دال ساخته شده است

در حالی که خوب است، هنوز واضح به نظر می رسد که تصویر با هوش مصنوعی تولید شده است. بنابراین، من سپس از DALL-E خواستم که آن را واقعی تر کند. برعکس، تصویر حتی جعلی تر به نظر می رسید (و صادقانه بگویم کمی ترسناک).
تلاش تصویر واقعی از یک سگ dall-e

استفاده از Photorealistic Custom GPT کمک می کند، اما برای دسترسی به آن به اشتراک ممتاز نیاز دارید. در غیر این صورت، من می توانم چندین مولد هنر هوش مصنوعی را توصیه کنم که تصاویر واقعی را تولید می کنند. Adobe Firefly بهترین پیشنهاد من است.

4 نرم افزار وقتی به آن می گویید کاری را انجام ندهد گوش نمی دهد

یکی از راه‌های نوشتن اعلان‌های بهتر در Midjourney، ChatGPT و سایر ابزارهای هوش مصنوعی این است که بگویید چه کاری را نمی‌خواهید نرم‌افزار انجام دهد. در بسیاری از موارد انجام این کار به نتایج بهتری منجر می شود. با این حال، DALL-E یک استثنا است.

در موارد متعدد، به DALL-E گفته‌ام که عناصر خاصی را در تصویر من وارد نکند. با این حال، با وجود آن، ابزار هنوز آنها را اضافه کرده است. گاهی اوقات، بازسازی تصویر کارساز بوده است، اما عدم نیاز به انجام این کار خوب است.

در مقابل، من به ندرت در هنگام استفاده از Adobe Firefly با این مشکل مواجه شده ام.

 

5 ناهماهنگی آن در مناطق خاص

بسیاری از تولیدکنندگان هنر هوش مصنوعی نقاط ضعفی دارند. به عنوان مثال، زمانی که من Photo AI را آزمایش کردم، به خصوص در ایجاد دست بد بود. DALL-E همچنین به دلیل داشتن ناهماهنگی در زمینه های مختلف مقصر است.

در حالی که DALL-E در ایجاد تصاویر عمومی عالی است، اما همیشه در ایجاد تصاویر افرادی که اشیایی را در دست دارند خوب نیست. به طرز عجیبی، نرم افزار در ایجاد صفحه نمایش کامپیوتر نیز ضعیف است. اغلب اوقات، یک خوشه تصادفی از اشکال به شما می دهد. درخواست از نرم افزار برای خاموش کردن صفحه نمایش کامپیوتر گاهی اوقات (اما نه همیشه) می تواند کمک کننده باشد.

6 سبک تصویر سازگار نیستند

DALL-E می تواند انواع مختلفی از تصاویر را ایجاد کند. می‌توانید هنر هوش مصنوعی شبیه نقاشی‌های رنگی ایجاد کنید و همچنین می‌توانید تصاویری با ظاهر سه‌بعدی ایجاد کنید. با این حال، این تنوع در ایجاد تصویر گاهی اوقات می تواند به سبک های ناسازگار منجر شود.

وقتی از DALL-E می‌خواهید یک تصویر ایجاد کند، باید در مورد آنچه می‌خواهید مشخص باشید. در غیر این صورت، شما می توانید به هر چیزی و همه چیز پایان دهید. اگر فقط در حال آزمایش با برنامه هستید، این مشکلی نیست، اما اگر یک سبک را در سراسر صفحه می خواهید.

7 اندازه مصنوع

اگر به دقت عکس‌هایتان اهمیت می‌دهید، اینکه اشیاء تصویرتان متناسب با آنچه در زندگی واقعی هستند به نظر برسند، حیاتی است. متأسفانه، DALL-E گاهی اوقات نمی تواند مصنوعات را آنطور که باید جلوه دهد. به عنوان مثال، اگر از نرم افزار بخواهید تصویری از شخصی که گوشی را در دست دارد ایجاد کند، گاهی اوقات تلفن خیلی بزرگ می شود.

در ابتدا، من فکر می کردم که درخواست از نرم افزار برای ایجاد زاویه بازتر تصویر، مشکل را حل می کند. با این حال، این در واقع اوضاع را بدتر کرد. علاوه بر این، فرد در نهایت جعلی به نظر می رسید. امتحان کردن دستورهای مختلف ویرایش DALL-E ممکن است برای شما مفید باشد، اما من هنوز راه حلی برای این مشکل پیدا نکرده ام.
تصویری از یک شخص با تلفن تولید شده در DALL-E

8 DALL-E با ایجاد مواد خارجی مبارزه می کند

در ابتدا فکر می‌کردم DALL-E راهی عالی برای ساخت تقویم‌های شخصی، کارت‌های تولد، کاغذ دیواری تلفن و موارد دیگر خواهد بود. با این حال، من به سرعت متوجه شدم که نرم افزار در این زمینه کار خوبی انجام نمی دهد.

به عنوان مثال، من در گذشته سعی کردم کاور کارت تولد را با DALL-E درست کنم. من می خواستم یک تصویر در برنامه ایجاد کنم و بعداً آن را در سرویسی مانند Moonpig آپلود کنم. متأسفانه، من به طور مداوم طرحی دریافت کردم که شامل یک کارت تولد در تصویر بود.

خطای کارت تولد DALL-E 3 در متن و طراحی

اگر واقعاً می خواهید از DALL-E برای این نوع طراحی ها استفاده کنید، پیشنهاد می کنم نگویید که از آن در کارت تولد استفاده خواهید کرد. در عوض، مشخص کنید که می خواهید برنامه چه چیزی بسازد. سپس می توانید بعداً اندازه را تنظیم کنید.

شاید بهتر باشد فقط تصویر را در DALL-E ایجاد کنید و متن را در یک برنامه دیگر اضافه کنید.

 

9 تصویر کم تلاش هنگام درخواست گزینه های متعدد

گاهی اوقات، من نمی دانم از چه طراحی هوش مصنوعی خاصی می خواهم استفاده کنم. روی آوردن به ژنراتورها و درخواست از آنها برای ایجاد چندین تنوع تصویر می تواند در این شرایط منطقی باشد. اما بر اساس تجربه شخصی، DALL-E اغلب هنگام ارائه چندین گزینه به من تنبل بوده است.

در بسیاری از موارد، تصاویری که من دریافت می کنم اغلب بسیار شبیه به هم هستند. در نتیجه باید مشخص باشید. من همچنین دریافتم که ساختن یک تصویر پس از دیگری به جای درخواست تغییرات متعدد، بهتر عمل کرده است.

در حالی که من عاشق استفاده از DALL-E به طور کلی هستم، نرم افزار کامل نیست و شما در نهایت با مشکلاتی مواجه خواهید شد. به عنوان مثال، در ساخت تصاویر واقعی بدون GPTهای سفارشی بد است. علاوه بر این، نرم افزار اغلب عناصری را که من نمی خواهم در تصویر حذف نمی کند. من همچنان پیشنهاد می کنم DALL-E را امتحان کنید. خودتان ببینید که آیا این مشکلات برای شما پیش می آید یا نه.

مطلب مرتبط:ابزار جدید هوش مصنوعی Adobe به شما امکان می دهد ۱۰۰۰۰ تصویر را همزمان ویرایش کنیدچگونه از ImgFlip برای ایجاد میم های تولید شده توسط هوش مصنوعی استفاده کنم

پست های مرتبط

مطالعه این پست ها رو از دست ندین!

نظرات

سوالات و نظراتتون رو با ما به اشتراک بذارید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

تماس جهت مشاوره