ChatGPT هنوز نمی تواند به این ۴ سوال آسان پاسخ دهد

لوگوی CHARGPT

ChatGPT یک موهبت الهی بوده است و مردم از آن برای همه چیز از برنامه ریزی روزانه تا ساخت وب سایت استفاده می کنند. اما حتی با دانش گسترده‌اش، چند معمای ساده وجود دارد که نمی‌توان آن‌ها را شکست.

1 معمای اسب دوانی

شما شش اسب دارید و می خواهید با آنها مسابقه دهید تا ببینید کدام یک سریعتر است. بهترین راه برای انجام این کار چیست؟

این یک سوال منطقی ساده است. سریعترین راه برای مسابقه دادن با آنها چیست؟ خوب، سریعترین راه این است که هر شش اسب را با هم مسابقه دهید و ببینید چه کسی اول می شود.

ChatGPT – بله، حتی آخرین مدل – غیر از این فکر می کند. با اطمینان پیشنهاد می‌کند که اسب‌ها را به دو گروه سه تایی تقسیم کنید، با آنها مسابقه دهید و سپس برندگان را با هم مسابقه دهید. اصرار دارد که این سریعترین راه برای شناسایی برنده با کمترین تعداد مسابقه است.


ChatGPT در یک سوال منطقی شکست خورده است

در یک سناریوی واقعی با یک مسیر باریک اسب، پاسخ ChatGPT ممکن است منطقی باشد. اما در این فرضی، هیچ محدودیتی برای تعداد اسب‌ها در یک زمان وجود ندارد. ChatGPT یک محدودیت از هوا اضافه می کند و منطق خود را بر اساس آن استوار می کند.

برای من، این نشان می‌دهد که ChatGPT واقعاً خلاقانه نیست. این یک واژه ساز است که بر اساس آموزشش منطقی ترین پاسخ به نظر می رسد. در اینجا، ما از قبل پاسخ را می دانستیم. اما، اگر این کار را نمی‌کردیم، پاسخ می‌تواند ما را نسبت به چیزهای بدیهی کور کند.

من تمام دستورات این مقاله را با استفاده از ChatGPT-4o با اشتراک پلاس آزمایش کردم.

2 کشاورز از رودخانه عبور می کند

کشاورز می خواهد از رودخانه ای بگذرد و یک گرگ، یک بز و یک کلم را با خود ببرد. او یک قایق با سه محفظه جداگانه امن دارد. اگر گرگ و بز در یک ساحل تنها باشند، گرگ بز را می خورد. اگر بز و کلم تنها باشند، بز کلم را می خورد. چگونه کشاورز می تواند همه آنها را بدون اینکه چیزی خورده شود به آن سوی رودخانه برساند؟

نسخه کلاسیک این معما (بدون محفظه های ایمن) ممکن است یک کودک پنج ساله را بیچاره کند، اما با وجود محفظه ها، پاسخ بی دردسر است. کشاورز باید گرگ و بز و کلم را در کوپه هایشان بگذارد و در یک سفر از رودخانه عبور کند. ساده

ChatGPT، با این حال، بخش مربوط به محفظه ها را نادیده می گیرد. این به کشاورز پیشنهاد می‌کند که چهار سفر رفت و برگشت انجام دهد تا همه چیز را با قایق‌های ایمن به آن طرف منتقل کند، با این فرض که حیوانات و کلم آسیب‌پذیر هستند. مثل اینکه ChatGPT در شکل سنتی معما گیر کرده است.

ChatGPT به سؤال عبور از رودخانه پاسخ نمی دهد

از آنجایی که نسخه کلاسیک این معما به طور کامل به صورت آنلاین منتشر شده است، هوش مصنوعی آن را پیش‌فرض می‌کند. این یادآوری است که ChatGPT مشکلات عقل سلیم انسانی را حل نمی کند. از الگوها استفاده می کند نه از منطق. در نتیجه، ChatGPT در یک معمای ساده مانند این شکست می خورد اما می تواند یک برنامه وب را از ابتدا بسازد.

من این را با مدل o1 نیز تست کردم، مدل ChatGPT با استدلال پیشرفته. متأسفانه همان اشتباه مدل 4o را انجام داد و پاسخ را اشتباه گرفت.

3 چپ فوری

آلن، باب، کالین، دیو و امیلی در یک دایره ایستاده اند. آلن در سمت چپ باب قرار دارد. باب در سمت چپ کالین قرار دارد. کالین در سمت چپ دیو قرار دارد. دیو بلافاصله در سمت چپ امیلی است. چه کسی در سمت راست فوری آلن قرار دارد؟

یک سوال ترفند دیگر برای آزمایش استدلال فضایی شما. با این تفاوت که شما نیازی به نمودار یا تصویرسازی ندارید. اولین بیت از اطلاعات پاسخ است: اگر آلن در سمت چپ بلافاصله باب باشد، باب باید در سمت راست بلافاصله آلن باشد. پاسخ باب است.

ChatGPT با سوالات مکانی مبارزه می کند. این به خوبی با کلمات و زبان ها کار می کند – ریاضیات و برنامه نویسی نیز زبان هستند – اما مشکلات فضایی آن را کاهش می دهد. سوالی مانند این به نظر می رسد که به محاسبات بصری نیاز دارد اما اینطور نیست و هوش مصنوعی را بیشتر به سمت بالا می برد.

ChatGPT یک سوال فضایی ناموفق است

در مورد من، ChatGPT تجسم خوبی از دایره ارائه کرد، اما نتیجه گرفت که امیلی در سمت راست آلن است. حتی با منطق خودش، این نادرست است: امیلی در سمت راست دیو است، نه آلن.

یک بار دیگر، ChatGPT می تواند هوش را شبیه سازی کند، اما واقعاً استدلال نیست. البته، این احتمال وجود دارد که اگر درخواست را برای خود امتحان کنید، ممکن است پاسخ صحیحی دریافت کنید. اما آیا عقل سلیم مبتنی بر شانس است؟ اگر از قبل پاسخ را نمی دانید، چگونه می توانید متوجه شوید که توهم هوش مصنوعی دریافت کرده اید یا پاسخ درستی دارید؟

 

4 رولت روسی

شما در حال بازی رولت روسی با یک هفت تیر شش تیر هستید. حریف شما پنج گلوله می زند، غلتک اسلحه را می چرخاند و به سمت خودش شلیک می کند، اما هیچ گلوله ای بیرون نمی آید. او به شما این امکان را می دهد که قبل از شلیک به سمت شما، غلتک ها را دوباره بچرخاند یا نه. آیا باید دوباره بچرخد؟

بله! او باید دوباره بچرخد. تنها یک اتاق خالی وجود دارد و حریف قبلاً از آن استفاده کرده است. یعنی اتاق بعدی حتما گلوله دارد. اگر محفظه‌ها دوباره بچرخند، به احتمال 1/6 روی محفظه خالی فرود آید.

ChatGPT با پیشنهاد دادن به حریف باید دوباره بچرخد اما سپس ریاضیات را به هم می زند، قوی شروع می شود. به اشتباه ادعا می کند که اگر اتاقک ها چرخانده نشوند، احتمال 5/6 کشنده بودن ضربه بعدی وجود دارد و سپس استدلال می کند که بدون توجه به چرخش، شانس یکسان است. در نهایت با خودش تناقض دارد.

شکست ChatGPT در سوال رولت روسی

می‌توانید از ChatGPT به‌عنوان یک تحلیل‌گر داده برای بررسی احتمالات استفاده کنید، اما همانطور که این معماها نشان می‌دهند، می‌تواند حتی در منطق ابتدایی هم بیفتد. در هر مورد، اشتباه هوش مصنوعی به راحتی قابل تشخیص بود زیرا ما از قبل پاسخ ها را می دانستیم. ChatGPT یک واژه ساز چیره دست است. پاسخ‌های آن چنان مطمئن و واضح هستند که حتی یک پاسخ اشتباه هم می‌تواند قانع‌کننده باشد. اگر نمی دانید این اشتباه است، ممکن است قربانی یک توهم هوش مصنوعی شوید.

این دستورات توسط تیمی از محققان GenAI گردآوری شده است. می توانید مقاله کامل را در arXiv بخوانید.

ChatGPT از بسیاری جهات درخشان است، اما این نمونه ها محدودیت های آن را به ما یادآوری می کنند. مثل ما فکر نمی کند؛ الگوها را باز می گرداند. هنگامی که از آن سؤالی مانند سؤال بالا می‌پرسید، به همان الگوی تکیه می‌کند و ممکن است در حلقه‌ای از اعتماد به نفس بیش از حد گیر کند.

از ChatGPT به عنوان یک ابزار استفاده کنید، نه عصا. برای طوفان فکری و خلاصه‌نویسی فوق‌العاده است – اما به آن به عنوان جایگزینی برای عقل سلیم انسانی اعتماد نکنید.

 

مطلب مرتبط:این هوش مصنوعی می‌تواند لهجه شما را حدس بزند و به طرز وحشتناکی دقیق استChatGPT این ۴ نوع وب سایت را از بین می برد

پست های مرتبط

مطالعه این پست ها رو از دست ندین!

نظرات

سوالات و نظراتتون رو با ما به اشتراک بذارید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

تماس جهت مشاوره