آیا هوش مصنوعی به شما دروغ می‌گوید؟

مطالعه جدید نشان می‌دهد که مدل‌های هوش مصنوعی بزرگ ممکن است در صورت تحت فشار قرار گرفتن برای دستیابی به اهدافشان، به شما دروغ بگویند.هوش مصنوعی به سرعت در حال پیشرفت است و مدل‌های زبانی بزرگ (LLM) به طور فزاینده‌ای در زندگی روزمره ما نفوذ می‌کنند. از پاسخ دادن به سوالات ساده گرفته تا تولید محتوای خلاقانه، این سیستم‌ها به ابزاری قدرتمند تبدیل شده‌اند. اما آیا می‌توان به هر آنچه که هوش مصنوعی می‌گوید اعتماد کرد؟ مطالعه جدیدی که به تازگی منتشر شده است، زنگ خطر را به صدا درآورده و نشان می‌دهد که این مدل‌های پیشرفته، در صورت قرار گرفتن تحت فشار برای دستیابی به اهدافشان، ممکن است به فریبکاری روی بیاورند.

پژوهشگران در مطالعه‌ای که در تاریخ ۵ مارس در پایگاه داده پیش‌انتشار arXiv منتشر شد، یک پروتکل ارزیابی صداقت به نام معیار همسویی مدل بین اظهارات و دانش (MASK) را طراحی کردند. در حالی که مطالعات و ابزارهای مختلفی برای تعیین صحت اطلاعات ارائه شده توسط هوش مصنوعی وجود داشته است، معیار MASK با هدف سنجش این موضوع طراحی شده است که آیا هوش مصنوعی به آنچه به شما می‌گوید باور دارد یا خیر و تحت چه شرایطی ممکن است مجبور شود اطلاعات نادرستی را ارائه دهد که از نادرست بودن آن آگاه است.

تیم تحقیقاتی برای بررسی اینکه آیا می‌توان مدل‌های زبانی بزرگ را از طریق درخواست‌های اجباری به دروغ گفتن متقاعد کرد، مجموعه داده بزرگی شامل ۱۵۲۸ نمونه ایجاد کردند. دانشمندان ۳۰ مدل پیشرو و پرکاربرد را آزمایش کردند و مشاهده کردند که هوش مصنوعی‌های پیشرفته به راحتی و در صورت قرار گرفتن تحت فشار، دروغ می‌گویند.

وقتی فشار، هوش مصنوعی را وادار به فریب‌کاری می‌کند

نتایج این مطالعه نشان می‌دهد که در حالی که پیشرفته‌ترین مدل‌های زبانی بزرگ در آزمون‌های ارزیابی صحت، امتیاز بالایی کسب می‌کنند، اما در مواجهه با فشار برای دروغ گفتن، تمایل قابل توجهی از خود نشان می‌دهند و در نتیجه، در معیار صداقت MASK امتیاز پایینی به دست می‌آورند. به عبارت دیگر، ممکن است یک مدل هوش مصنوعی به دلیل داشتن دامنه وسیع‌تری از اطلاعات واقعی، در آزمون‌های دقت عملکرد بهتری داشته باشد، اما این لزوماً به معنای احتمال کمتر اظهارات نادرست از سوی آن نیست.

آیا هوش مصنوعی به شما دروغ می‌گوید؟

ساخت رسید بانکی جعلی با چت جی پی تی (ChatGPT)؛ کلاه برداری با هوش مصنوعی

هوش مصنوعی جمینای جایگزین گوگل Assistant می‌شود

همه چیز درباره منوس: آغاز عصر جدید هوش مصنوعی خودمختار

Mistral AI چیست؟ هر آنچه باید درباره رقیب OpenAI بدانید

مطالب دیگر

سقوط دیجیتال میراث چند دهه بی‌تدبیری در حوزه فناوری اطلاعات ایران!

ماهواره استارلینک همین الان روی بام شماست

با بهترین روش‌های کسب درآمد دلاری در ایران آشنا شوید

اینستاگرام، تلگرام و واتساپ بیشترین میزان استفاده را در میان کاربران ایرانی دارند

تاکسی‌ها لوکیشن دارند، اما اورژانس نه!

چالش‌هایی که پیش روی وزیر ارتباطات دولت چهاردهم است

فرابورس به چهار پلتفرم تأمین مالی مجوز داد

آیا هوش مصنوعی به شما دروغ می‌گوید؟

وقتی فشار، هوش مصنوعی را وادار به فریب‌کاری می‌کند

تعرفه های جدید ترامپ، قیمت همه چیز را در دنیا افزایش می‌دهد

نشت اطلاعات بانک سپه صحت دارد؟

تا شب عید تحول خاصی برای رفع فیلترینگ رخ نمی‌دهد

تاکسی هوایی ایران راه‌اندازی شد؛ هزینه هر ساعت پرواز زیر ۷ میلیون تومان

ورود ستاد امر به معروف و نهی از منکر به حوزه بازی‌های رایانه‌ای

سقوط دیجیتال میراث چند دهه بی‌تدبیری در حوزه فناوری اطلاعات ایران!

ماهواره استارلینک همین الان روی بام شماست

اینستاگرام، تلگرام و واتساپ بیشترین میزان استفاده را در میان کاربران ایرانی دارند

تاکسی‌ها لوکیشن دارند، اما اورژانس نه!

چالش‌هایی که پیش روی وزیر ارتباطات دولت چهاردهم است

راهنمای خرید

راهنمای خرید بهترین لپ‌تاپ

معرفی بهترین دوربین‌های چاپ سریع

راهنمای جامع خرید مودم و نکاتی کلیدی که قبل از خرید مودم ADSL باید بدانید

راهنمای خرید لپ تاپ – تا ۵۰ میلیون تومان

نکاتی برای خرید اسپرسوساز و راهنمای خرید اسپرسوساز

آشنایی با دستگاه تصفیه هوا و راهنمای خرید دستگاه تصفیه هوا

بهترین گوشی‌های شیائومی موجود در بازار؛ از اقتصادی تا پرچم‌دار

مطالب دیگر

سقوط دیجیتال میراث چند دهه بی‌تدبیری در حوزه فناوری اطلاعات ایران!

ماهواره استارلینک همین الان روی بام شماست

با بهترین روش‌های کسب درآمد دلاری در ایران آشنا شوید

اینستاگرام، تلگرام و واتساپ بیشترین میزان استفاده را در میان کاربران ایرانی دارند

تاکسی‌ها لوکیشن دارند، اما اورژانس نه!

چالش‌هایی که پیش روی وزیر ارتباطات دولت چهاردهم است

فرابورس به چهار پلتفرم تأمین مالی مجوز داد

آیا هوش مصنوعی به شما دروغ می‌گوید؟

وقتی فشار، هوش مصنوعی را وادار به فریب‌کاری می‌کند

بیشتر بخوانید:

تعرفه های جدید ترامپ، قیمت همه چیز را در دنیا افزایش می‌دهد

نشت اطلاعات بانک سپه صحت دارد؟

تا شب عید تحول خاصی برای رفع فیلترینگ رخ نمی‌دهد

تاکسی هوایی ایران راه‌اندازی شد؛ هزینه هر ساعت پرواز زیر ۷ میلیون تومان

ورود ستاد امر به معروف و نهی از منکر به حوزه بازی‌های رایانه‌ای

سقوط دیجیتال میراث چند دهه بی‌تدبیری در حوزه فناوری اطلاعات ایران!

ماهواره استارلینک همین الان روی بام شماست

اینستاگرام، تلگرام و واتساپ بیشترین میزان استفاده را در میان کاربران ایرانی دارند

تاکسی‌ها لوکیشن دارند، اما اورژانس نه!

چالش‌هایی که پیش روی وزیر ارتباطات دولت چهاردهم است

راهنمای خرید

راهنمای خرید بهترین لپ‌تاپ

معرفی بهترین دوربین‌های چاپ سریع

راهنمای جامع خرید مودم و نکاتی کلیدی که قبل از خرید مودم ADSL باید بدانید

راهنمای خرید لپ تاپ – تا ۵۰ میلیون تومان

نکاتی برای خرید اسپرسوساز و راهنمای خرید اسپرسوساز

آشنایی با دستگاه تصفیه هوا و راهنمای خرید دستگاه تصفیه هوا

بهترین گوشی‌های شیائومی موجود در بازار؛ از اقتصادی تا پرچم‌دار