مدلهای هوش مصنوعی OpenAI و Google موفق شدند بدون دخالت انسانی، به امتیازی در سطح مدال طلا در المپیاد جهانی ریاضی ۲۰۲۵ دست یابند.
پیشرفت چشمگیر مدلهای هوش مصنوعی در IMO
در سال ۲۰۲۵، هر دو شرکت OpenAI و Google مدلهایی ارائه کردند که توانستند به ۵ سؤال از ۶ سؤال المپیاد جهانی ریاضی پاسخ صحیح دهند. این رقابت معتبر بینالمللی از سختترین آزمونهای سطح دبیرستانی جهان است و تنها درصد کمی از شرکتکنندگان انسانی به چنین عملکردی دست پیدا میکنند.
از سیستمهای «formal» تا مدلهای زبانی بدون کمک انسانی
سال گذشته، Google با سیستمی formal که نیاز به ترجمه انسانی داشت مدال نقره گرفت، اما امسال هر دو شرکت از مدلهای «informal» استفاده کردند؛ یعنی مدلهایی که خودشان میتوانند سؤال را به زبان طبیعی درک کنند و اثبات بنویسند.این دستاورد، گامی مهم در جهت ارتقاء توانایی استدلال در مدلهای هوش مصنوعی محسوب میشود.
حاشیهها؛ از زمان اعلام نتایج تا نحوه ارزیابی
پس از اعلام زودهنگام موفقیت OpenAI، مدیرعامل Google DeepMind و تیمش انتقاداتی را مطرح کردند. آنها تأکید داشتند که به درخواست برگزارکنندگان IMO صبر کردهاند تا ارزیابی رسمی انجام شود. در مقابل، OpenAI میگوید از سه داور باتجربه برای ارزیابی مستقل استفاده کرده و صرفاً بهدلیل ناهماهنگی، زودتر اطلاعرسانی کرده است.
تحلیل iTrends
از نگاه iTrends، این رقابت نشان میدهد فاصله میان شرکتهای پیشرو در هوش مصنوعی کاهش یافته است. در حالی که OpenAI پیشتر پیشتاز محسوب میشد، عملکرد Google نشان داد که میدان رقابت فشردهتر شده. همچنین استفاده از آزمونهایی مانند المپیاد جهانی ریاضی بهعنوان معیار سنجش مدلهای زبانی، تحولی جدی در جهت سنجش توانمندی استدلال و منطق این سیستمها محسوب میشود.