دستاورد جدید MIT: هوش مصنوعی یاد میگیرد چه زمانی «بیشتر فکر کند»

پژوهشگران در دانشگاه MIT روشی هوشمندانهتر برای تفکر مدلهای زبانی بزرگ (LLMs) ابداع کردهاند که به آنها اجازه میدهد میزان محاسبات خود را بر اساس سختی سوال تنظیم کنند. این تکنیک نوآورانه، که «استدلال تطبیقی» نام دارد، میتواند مصرف انرژی سیستمهای هوش مصنوعی را به شدت کاهش دهد.
در آزمایشها، این روش توانست با نصف محاسبات روشهای فعلی به همان دقت دست یابد و حتی به مدلهای کوچکتر اجازه داد در مسائل پیچیده، عملکردی بهتر از مدلهای بزرگتر داشته باشند. این دستاورد میتواند راه را برای استفاده از هوش مصنوعی در کاربردهای حساستر و سریعتر هموار کند.
مشکل اصلی: بودجه محاسباتی ثابت برای همه مسائل
برای افزایش دقت مدلهای زبانی در پاسخ به سوالات سخت، محققان به آنها «زمان بیشتری برای فکر کردن» میدهند. اما رویکردهای رایج، یک بودجه محاسباتی ثابت را برای هر سوال، چه آسان و چه دشوار، در نظر میگیرند. این یعنی مدل یا منابع را برای سوالات ساده هدر میدهد، یا توان کافی برای حل مسائل واقعاً پیچیده را ندارد.
راهحل MIT: استدلال تطبیقی و تخصیص پویای منابع
روش جدید محققان MIT که مقیاسبندی تطبیقی (instance-adaptive scaling) نام دارد، این مشکل را حل میکند. این سیستم به مدل اجازه میدهد تا به صورت پویا، بودجه محاسباتی خود را در حین حل مسئله تنظیم کند.
این فرآیند با استفاده از یک مدل کمکی به نام مدل پاداش فرآیند (PRM) انجام میشود. این مدل در هر مرحله، راهحلهای جزئی تولید شده را ارزیابی کرده و تخمین میزند که کدام یک شانس بیشتری برای رسیدن به پاسخ صحیح دارد. اگر مدل از یک مسیر مطمئن باشد، مسیرهای دیگر را دنبال نمیکند و در محاسبات صرفهجویی میکند.
چالش اصلی: کالیبره کردن مدل برای جلوگیری از خوشبینی بیش از حد
یکی از مشکلات مدلهای پاداش فرآیند (PRM) فعلی این است که اغلب بیش از حد «خوشبین» هستند و شانس موفقیت یک مسیر را بیشتر از واقعیت تخمین میزنند. این موضوع باعث میشد سیستم، بودجه محاسباتی را بیش از حد کاهش دهد.
تیم MIT برای حل این مشکل، یک روش کالیبراسیون ابداع کردند. به جای یک امتیاز قطعی، مدل کالیبره شده یک «دامنه احتمال» ارائه میدهد که عدم قطعیت را بهتر منعکس میکند. این واسنجی دقیق باعث میشود سیستم با اطمینان بیشتری تصمیم بگیرد که چه زمانی محاسبات را کاهش دهد، بدون اینکه دقت فدا شود.
پرسشهای متداول درباره روش جدید MIT
مزیت اصلی این روش جدید چیست؟
افزایش چشمگیر بهرهوری محاسباتی (تا ۵۰ درصد صرفهجویی) و در عین حال حفظ یا افزایش دقت. این روش به مدلهای کوچکتر اجازه میدهد تا در مسائل پیچیده به خوبی مدلهای بزرگ عمل کنند.
این روش چگونه با نحوه تفکر انسان مقایسه میشود؟
این فرآیند شباهت زیادی به تفکر انسان دارد. ما نیز هنگام حل یک مسئله، راهحلهای جزئی را ارزیابی کرده و تصمیم میگیریم که کدام مسیر را دنبال کنیم، کدام را رها کرده یا به مرحله قبل بازگردیم.
کاربردهای آینده این تکنیک چه خواهد بود؟
پژوهشگران قصد دارند از این تکنیک در زمینههایی مانند تولید کد (code generation) و عاملهای هوشمند (AI agents) استفاده کنند. این قابلیت برای ساخت سیستمهای هوش مصنوعی ایمنتر، سازگارتر و قابل اطمینانتر ضروری است.
