ChatGPT هنوز نمی تواند به این ۴ سوال آسان پاسخ دهد
ChatGPT یک موهبت الهی بوده است و مردم از آن برای همه چیز از برنامه ریزی روزانه تا ساخت وب سایت استفاده می کنند. اما حتی با دانش گستردهاش، چند معمای ساده وجود دارد که نمیتوان آنها را شکست.
1 معمای اسب دوانی
شما شش اسب دارید و می خواهید با آنها مسابقه دهید تا ببینید کدام یک سریعتر است. بهترین راه برای انجام این کار چیست؟
این یک سوال منطقی ساده است. سریعترین راه برای مسابقه دادن با آنها چیست؟ خوب، سریعترین راه این است که هر شش اسب را با هم مسابقه دهید و ببینید چه کسی اول می شود.
ChatGPT – بله، حتی آخرین مدل – غیر از این فکر می کند. با اطمینان پیشنهاد میکند که اسبها را به دو گروه سه تایی تقسیم کنید، با آنها مسابقه دهید و سپس برندگان را با هم مسابقه دهید. اصرار دارد که این سریعترین راه برای شناسایی برنده با کمترین تعداد مسابقه است.
در یک سناریوی واقعی با یک مسیر باریک اسب، پاسخ ChatGPT ممکن است منطقی باشد. اما در این فرضی، هیچ محدودیتی برای تعداد اسبها در یک زمان وجود ندارد. ChatGPT یک محدودیت از هوا اضافه می کند و منطق خود را بر اساس آن استوار می کند.
برای من، این نشان میدهد که ChatGPT واقعاً خلاقانه نیست. این یک واژه ساز است که بر اساس آموزشش منطقی ترین پاسخ به نظر می رسد. در اینجا، ما از قبل پاسخ را می دانستیم. اما، اگر این کار را نمیکردیم، پاسخ میتواند ما را نسبت به چیزهای بدیهی کور کند.
من تمام دستورات این مقاله را با استفاده از ChatGPT-4o با اشتراک پلاس آزمایش کردم.
2 کشاورز از رودخانه عبور می کند
کشاورز می خواهد از رودخانه ای بگذرد و یک گرگ، یک بز و یک کلم را با خود ببرد. او یک قایق با سه محفظه جداگانه امن دارد. اگر گرگ و بز در یک ساحل تنها باشند، گرگ بز را می خورد. اگر بز و کلم تنها باشند، بز کلم را می خورد. چگونه کشاورز می تواند همه آنها را بدون اینکه چیزی خورده شود به آن سوی رودخانه برساند؟
نسخه کلاسیک این معما (بدون محفظه های ایمن) ممکن است یک کودک پنج ساله را بیچاره کند، اما با وجود محفظه ها، پاسخ بی دردسر است. کشاورز باید گرگ و بز و کلم را در کوپه هایشان بگذارد و در یک سفر از رودخانه عبور کند. ساده
ChatGPT، با این حال، بخش مربوط به محفظه ها را نادیده می گیرد. این به کشاورز پیشنهاد میکند که چهار سفر رفت و برگشت انجام دهد تا همه چیز را با قایقهای ایمن به آن طرف منتقل کند، با این فرض که حیوانات و کلم آسیبپذیر هستند. مثل اینکه ChatGPT در شکل سنتی معما گیر کرده است.
از آنجایی که نسخه کلاسیک این معما به طور کامل به صورت آنلاین منتشر شده است، هوش مصنوعی آن را پیشفرض میکند. این یادآوری است که ChatGPT مشکلات عقل سلیم انسانی را حل نمی کند. از الگوها استفاده می کند نه از منطق. در نتیجه، ChatGPT در یک معمای ساده مانند این شکست می خورد اما می تواند یک برنامه وب را از ابتدا بسازد.
من این را با مدل o1 نیز تست کردم، مدل ChatGPT با استدلال پیشرفته. متأسفانه همان اشتباه مدل 4o را انجام داد و پاسخ را اشتباه گرفت.
3 چپ فوری
آلن، باب، کالین، دیو و امیلی در یک دایره ایستاده اند. آلن در سمت چپ باب قرار دارد. باب در سمت چپ کالین قرار دارد. کالین در سمت چپ دیو قرار دارد. دیو بلافاصله در سمت چپ امیلی است. چه کسی در سمت راست فوری آلن قرار دارد؟
یک سوال ترفند دیگر برای آزمایش استدلال فضایی شما. با این تفاوت که شما نیازی به نمودار یا تصویرسازی ندارید. اولین بیت از اطلاعات پاسخ است: اگر آلن در سمت چپ بلافاصله باب باشد، باب باید در سمت راست بلافاصله آلن باشد. پاسخ باب است.
ChatGPT با سوالات مکانی مبارزه می کند. این به خوبی با کلمات و زبان ها کار می کند – ریاضیات و برنامه نویسی نیز زبان هستند – اما مشکلات فضایی آن را کاهش می دهد. سوالی مانند این به نظر می رسد که به محاسبات بصری نیاز دارد اما اینطور نیست و هوش مصنوعی را بیشتر به سمت بالا می برد.
در مورد من، ChatGPT تجسم خوبی از دایره ارائه کرد، اما نتیجه گرفت که امیلی در سمت راست آلن است. حتی با منطق خودش، این نادرست است: امیلی در سمت راست دیو است، نه آلن.
یک بار دیگر، ChatGPT می تواند هوش را شبیه سازی کند، اما واقعاً استدلال نیست. البته، این احتمال وجود دارد که اگر درخواست را برای خود امتحان کنید، ممکن است پاسخ صحیحی دریافت کنید. اما آیا عقل سلیم مبتنی بر شانس است؟ اگر از قبل پاسخ را نمی دانید، چگونه می توانید متوجه شوید که توهم هوش مصنوعی دریافت کرده اید یا پاسخ درستی دارید؟
4 رولت روسی
شما در حال بازی رولت روسی با یک هفت تیر شش تیر هستید. حریف شما پنج گلوله می زند، غلتک اسلحه را می چرخاند و به سمت خودش شلیک می کند، اما هیچ گلوله ای بیرون نمی آید. او به شما این امکان را می دهد که قبل از شلیک به سمت شما، غلتک ها را دوباره بچرخاند یا نه. آیا باید دوباره بچرخد؟
بله! او باید دوباره بچرخد. تنها یک اتاق خالی وجود دارد و حریف قبلاً از آن استفاده کرده است. یعنی اتاق بعدی حتما گلوله دارد. اگر محفظهها دوباره بچرخند، به احتمال 1/6 روی محفظه خالی فرود آید.
ChatGPT با پیشنهاد دادن به حریف باید دوباره بچرخد اما سپس ریاضیات را به هم می زند، قوی شروع می شود. به اشتباه ادعا می کند که اگر اتاقک ها چرخانده نشوند، احتمال 5/6 کشنده بودن ضربه بعدی وجود دارد و سپس استدلال می کند که بدون توجه به چرخش، شانس یکسان است. در نهایت با خودش تناقض دارد.
میتوانید از ChatGPT بهعنوان یک تحلیلگر داده برای بررسی احتمالات استفاده کنید، اما همانطور که این معماها نشان میدهند، میتواند حتی در منطق ابتدایی هم بیفتد. در هر مورد، اشتباه هوش مصنوعی به راحتی قابل تشخیص بود زیرا ما از قبل پاسخ ها را می دانستیم. ChatGPT یک واژه ساز چیره دست است. پاسخهای آن چنان مطمئن و واضح هستند که حتی یک پاسخ اشتباه هم میتواند قانعکننده باشد. اگر نمی دانید این اشتباه است، ممکن است قربانی یک توهم هوش مصنوعی شوید.
این دستورات توسط تیمی از محققان GenAI گردآوری شده است. می توانید مقاله کامل را در arXiv بخوانید.
ChatGPT از بسیاری جهات درخشان است، اما این نمونه ها محدودیت های آن را به ما یادآوری می کنند. مثل ما فکر نمی کند؛ الگوها را باز می گرداند. هنگامی که از آن سؤالی مانند سؤال بالا میپرسید، به همان الگوی تکیه میکند و ممکن است در حلقهای از اعتماد به نفس بیش از حد گیر کند.
از ChatGPT به عنوان یک ابزار استفاده کنید، نه عصا. برای طوفان فکری و خلاصهنویسی فوقالعاده است – اما به آن به عنوان جایگزینی برای عقل سلیم انسانی اعتماد نکنید.
مطلب مرتبط:این هوش مصنوعی میتواند لهجه شما را حدس بزند و به طرز وحشتناکی دقیق است – ChatGPT این ۴ نوع وب سایت را از بین می برد