سری جدیدی از مدلهای استدلالی برای حل مشکلات سخت. هماکنون در دسترس است:
محدودیت درخواستها اکنون 50 پرسش در هفته برای نسخه پیشنمایش o1 و 50 پرسش در روز برای o1-mini است. ما یک سری جدید از مدلهای هوش مصنوعی طراحی کردهایم که زمان بیشتری را برای فکر کردن قبل از پاسخ دادن صرف میکنند. این مدلها میتوانند از طریق استدلال به وظایف پیچیده رسیدگی کنند و مشکلات سختتری را نسبت به مدلهای قبلی در علوم، کدنویسی و ریاضیات حل کنند.
امروز اولین مدل از این سری را در چت جی پی تی و API (رابط برنامه نویسی کاربردی)خود عرضه میکنیم. این یک پیشنمایش است و انتظار داریم که بهروزرسانیها و بهبودهای منظمی داشته باشد. همراه با این انتشار، ارزیابیهایی برای نسخه بعدی که در حال توسعه است نیز ارائه میکنیم.
چگونه کار میکند:
ما این مدلها را طوری آموزش دادهایم که قبل از پاسخ دادن به مشکلات، زمان بیشتری را برای فکر کردن اختصاص دهند، درست مثل یک انسان. از طریق این آموزشها، مدلها یاد میگیرند که فرآیند تفکر خود را اصلاح کنند، راهبردهای مختلف را امتحان کنند و اشتباهات خود را بشناسند.
در آزمایشهای ما، مدل بهروزشده بعدی عملکردی مشابه با دانشجویان دکترا در انجام وظایف دشوار در فیزیک، شیمی و زیستشناسی داشت. همچنین متوجه شدیم که این مدل در ریاضیات و کدنویسی هم عملکرد عالی دارد. در یک آزمون ورودی برای المپیاد بینالمللی ریاضی (IMO)، GPT-4o تنها 13 درصد از مسائل را درست حل کرد، در حالی که مدل استدلالی 83 درصد از مسائل را درست حل کرد. تواناییهای کدنویسی این مدل نیز در مسابقات ارزیابی شد و به درصد 89 در رقابتهای Codeforces رسید. میتوانید جزئیات بیشتری را در پست فنی ما بخوانید.
بهعنوان یک مدل اولیه، هنوز بسیاری از ویژگیهایی که ChatGPT را مفید میکنند (مانند مرور وب برای اطلاعات و آپلود فایلها و تصاویر) در این مدل وجود ندارد. برای بسیاری از کاربردهای عادی، GPT-4o در کوتاهمدت توانایی بیشتری خواهد داشت.
اما برای وظایف پیچیده استدلالی، این مدل پیشرفت بزرگی است و نشاندهنده یک سطح جدید از قابلیتهای هوش مصنوعی است. با توجه به این موضوع، ما شمارش را از ابتدا شروع کرده و این سری را OpenAI o1 نامگذاری کردهایم.
ایمنی
ایمنی بهعنوان بخشی از توسعه این مدلهای جدید، ما یک روش آموزشی جدید برای ایمنی طراحی کردهایم که از توانایی استدلال آنها استفاده میکند تا این مدلها به دستورالعملهای ایمنی و هماهنگی پایبند باشند. با توانایی استدلال درباره قوانین ایمنی در موقعیتهای مختلف، این مدلها میتوانند این قوانین را بهتر اجرا کنند.
یکی از روشهای سنجش ایمنی این است که ببینیم چقدر مدلها همچنان به قوانین ایمنی پایبند میمانند اگر کاربری سعی کند آنها را دور بزند (که به این کار جیلبریک کردن میگویند). در یکی از سختترین آزمونهای جیلبریک، مدل GPT-4o امتیاز 22 از 100 را کسب کرد، در حالی که مدل o1-preview امتیاز 84 را به دست آورد. شما میتوانید اطلاعات بیشتری را در کارت سیستمی و پست تحقیقاتی ما بخوانید.
برای هماهنگی با تواناییهای جدید این مدلها، ما کارهای مربوط به ایمنی خود را تقویت کردهایم، از جمله همکاری با دولتهای فدرال و ساختارهای داخلی. این شامل آزمایشها و ارزیابیهای دقیق با استفاده از چارچوب آمادگی ما، تیمهای ارزیابی پیشرفته، و فرآیندهای بررسی در سطح هیئت مدیره، از جمله توسط کمیته ایمنی و امنیت است.
برای پیشبرد تعهد ما به ایمنی هوش مصنوعی، اخیرا توافقنامههایی رسمی با مؤسسات ایمنی هوش مصنوعی ایالات متحده و بریتانیا انجام دادهایم. ما اجرای این توافقنامهها را آغاز کردهایم و به این مؤسسات دسترسی اولیه به نسخه تحقیقاتی این مدل را دادهایم. این یک گام مهم در همکاری ما بود که به ایجاد یک فرآیند برای تحقیق، ارزیابی و آزمایش مدلهای آینده قبل و بعد از انتشار عمومی آنها کمک میکند.
این مدلها برای چه کسانی مناسب هستند؟ این قابلیتهای پیشرفته استدلال ممکن است برای کسانی که با مشکلات پیچیده در علم، کدنویسی، ریاضیات و زمینههای مشابه سروکار دارند، بسیار مفید باشد. بهعنوان مثال، مدل o1 میتواند توسط محققان حوزه سلامت برای توضیح دادههای توالییابی سلولی استفاده شود، یا توسط فیزیکدانها برای تولید فرمولهای ریاضی پیچیده مورد نیاز در اپتیک کوانتومی، و توسط توسعهدهندگان در تمام زمینهها برای ایجاد و اجرای گردشهای کاری چند مرحلهای به کار رود.
OpenAI o1-mini
سری o1 در تولید و رفع اشکال کدهای پیچیده بسیار عالی عمل میکند. برای ارائه یک راهحل کارآمدتر برای توسعهدهندگان، ما مدل OpenAI o1-mini را نیز عرضه میکنیم؛ این مدل سریعتر و ارزانتر است و در کدنویسی بسیار مؤثر عمل میکند. بهعنوان یک مدل کوچکتر، o1-mini نسبت به o1-preview تا 80 درصد ارزانتر است و به یک مدل قوی و مقرونبهصرفه برای کاربردهایی تبدیل شده که به استدلال نیاز دارند ولی به دانش گسترده جهانی نیازی ندارند.
چگونه از OpenAI o1 استفاده کنیم؟
کاربران ChatGPT Plus و تیمها از امروز به مدلهای o1 در ChatGPT دسترسی خواهند داشت. هر دو مدل o1-preview و o1-mini را میتوان بهصورت دستی از فهرست مدلها انتخاب کرد. در ابتدای عرضه، محدودیت هفتگی 30 پیام برای o1-preview و 50 پیام برای o1-mini خواهد بود. ما در تلاش هستیم تا این محدودیتها را افزایش دهیم و به ChatGPT این امکان را بدهیم که بهطور خودکار بهترین مدل را برای هر درخواست انتخاب کند.
تصویری از فهرست کشویی جدید ChatGPT که گزینه مدل “o1-preview” را نشان میدهد، بر روی یک پسزمینه انتزاعی زرد و آبی روشن نمایش داده میشود.
توسعهدهندگانی که واجد شرایط سطح استفاده API 5 هستند، از امروز میتوانند با هر دو مدل در API نمونهسازی کنند، با محدودیت 20 درخواست در دقیقه. ما در حال افزایش این محدودیتها پس از آزمایشهای بیشتر هستیم. API این مدلها فعلاً شامل قابلیتهایی مانند فراخوانی توابع، استریم کردن، پشتیبانی از پیامهای سیستمی و دیگر ویژگیها نمیشود. برای شروع، میتوانید مستندات API را بررسی کنید.
ما همچنین برنامه داریم دسترسی به o1-mini را برای تمام کاربران رایگان ChatGPT فراهم کنیم.
پیش بینی در آینده
این پیشنمایشی اولیه از مدلهای استدلالی در ChatGPT و API است. علاوه بر بهروزرسانی مدلها، ما انتظار داریم ویژگیهایی مانند مرور، آپلود فایل و تصاویر و دیگر امکانات را اضافه کنیم تا این مدلها برای همه مفیدتر شوند.
ما همچنین برنامه داریم به توسعه و عرضه مدلهای جدید در سری GPT، علاوه بر سری جدید OpenAI o1 ادامه دهیم.
نظرات در مورد : معرفی مدل OpenAI – هوش مصنوعی 01