ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

GPT-5
کسب و کار

رویداد معرفی GPT-5 حاشیه‌ساز شد؛ نمایش نمودارهای غیرواقعی توسط OpenAI؟

پس از اشاره کاربران به این مشکل عجیب، سم آلتمن و OpenAI مجبور به عذرخواهی از کاربران شده‌اند.

جواد تاجی
نوشته شده توسط جواد تاجی | ۱۷ مرداد ۱۴۰۴ | ۱۸:۰۳

در جریان رویداد معرفی GPT-5 که شب گذشته برگزار شد، OpenAI چند نمودار را نمایش داد که عملکرد مدل جدید را بسیار چشمگیر نشان می‌دادند. اما با کمی دقت، مشخص شد برخی از این نمودارها مشکل بزرگی دارند که باعث می‌شود مصرف‌کنندگان درک درستی از پیشرفت GPT-5 نداشته باشند.

براساس گزارش ورج، یکی از نمودارهای نمایش داده شده مربوط به ارزیابی «فریب» مدل‌ها بوده که مقیاس‌ آن به‌طور عجیب‌و‌غریبی نامرتب بوده است. برای مثال، در بخش «فریب در کدنویسی»، نمودار روی صحنه نشان می‌داد که GPT-5 در حالت «با تفکر» نرخ فریب 50 درصدی دارد. این عدد با نرخ 47.4 درصدی مدل کوچک‌تر o3 مقایسه شده بود، اما ستون مربوط به o3 به شکل غیرمنطقی بلندتر ترسیم شده است.

نکته جالب دیگر اینکه در وبلاگ رسمی OpenAI ارقام متفاوت و درست‌تری وجود دارد و در آن نرخ فریب GPT-5 برابر با 16.5 درصد ذکر شده است.

مشکل بزرگ نمودارهای مربوط به GPT-5

همانطور که در تصویر زیر قابل مشاهده است، امتیازات o3 و GPT-4o در بنچمارک SWE-bench Verified اعداد متفاوتی را نشان می‌دهد اما اندازه ستون آنها یکسان ترسیم شده است. همچنین GPT-‌5 با وجود اختلاف 5 امتیازی نسبت به o3 ستون بسیار بلندتری دارد.

مشکل چارت GPT-5

این اشتباهات به‌قدری واضح بوده و با انتقاد کاربران در شبکه‌های اجتماعی همراه بود که «سم آلتمن، مدیرعامل OpenAI، آن را «اشتباه بزرگ نموداری» نامید و گفت نسخه صحیح در وب‌سایت شرکت منتشر شده است.

یکی از اعضای تیم بازاریابی OpenAI هم عذرخواهی کرده و در پست خود نوشت:

«نمودار را در وبلاگ اصلاح کردیم، دوستان. بابت این خطای ناخواسته عذرخواهی می‌کنیم.»

OpenAI تاکنون به درخواست رسانه‌ها برای اظهار نظر بیشتر پاسخ نداده است. مشخص نیست این نمودارها با کمک GPT-5 تهیه شده‌اند یا خیر، اما چنین خطایی در روز رونمایی بزرگ، آن هم زمانی که شرکت روی «پیشرفت چشمگیر در کاهش خطاها و توهمات» مدل جدید تاکید داشت، چندان خوشایند به نظر نمی‌رسد.

جواد تاجی

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و بیشتر از سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی