به گزارش بخش اخبار فناوری زوم تک , در یک جهش بزرگ در حوزه هوش مصنوعی، استارتاپ چینی DeepSeek مدل زبان بزرگ جدیدی به نام DeepSeek-R1 را به صورت متن باز عرضه کرده است. این مدل که با مدل های تجاری مانند o1 OpenAI رقابت میکند، در انجام وظایف مختلف از جمله پاسخ به سوالات پیچیده، تولید متن و حل مسائل ریاضی عملکردی چشمگیر از خود نشان داده است. دسترسی آزاد به این مدل، نوید بخش تحولی بزرگ در توسعه و کاربرد هوش مصنوعی است.
هوش مصنوعی متن باز DeepSeek-R1: رقیب جدید غول های هوش مصنوعی
شرکت DeepSeek، استارتاپی چینی که به خاطر ارائه فناوری های هوش مصنوعی متن باز معروف است، از مدل زبانی بزرگ جدیدی به نام DeepSeek-R1 رو نمایی کرد. این مدل که بر پایه مدل ترکیبی DeepSeek V3 ساخته شده، در انجام وظایف ریاضی، کد نویسی و استدلال، عملکردی در سطح مدل o1 شرکت OpenAI دارد.
اما نکته جالب توجه این است که R1 به دلیل متن باز بودن و هزینه های محاسباتی کمتر، 90 تا 95 درصد مقرون به صرفه تر از مدل OpenAI است. این خبر میتواند برای توسعه دهندگان و شرکت هایی که به دنبال استفاده از هوش مصنوعی هستند، بسیار جذاب باشد.
R1 چگونه کار میکند؟
R1 از ترکیبی از یاد گیری تقویتی و تنظیم دقیق نظارت شده برای انجام وظایف استدلالی پیچیده استفاده میکند. این مدل در واقع نسخه بهبود یافته DeepSeek-R1-Zero است که فقط با یاد گیری تقویتی آموزش دیده بود.
عملکرد R1 در آزمون ها
DeepSeek-R1 در آزمون های مختلفی مورد ارزیابی قرار گرفته و نتایج چشمگیری را کسب کرده است. برای مثال، در آزمون های ریاضی AIME 2024 امتیاز 79.8 درصد و در MATH-500 امتیاز 97.3 درصد را کسب کرد. همچنین در Codeforces به رتبه 2029 دست یافت که بهتر از 96.3 درصد از برنامه نویسان انسانی است.
مقایسه R1 با o1
در مقایسه با o1-1217، مدل R1 در آزمون های AIME 2024 و MATH-500 عملکردی تقریبا برابر و در Codeforces عملکردی حتی بهتر داشته است.
هزینه های R1
یکی از مزایای اصلی R1، هزینه بسیار کمتر آن نسبت به o1 است. در حالی که مدل o1 برای هر میلیون توکن ورودی 15 دلار و برای هر میلیون توکن خروجی 60 دلار هزینه دارد، DeepSeek Reasoner که مبتنی بر مدل R1 است، برای هر میلیون توکن ورودی 0.55 دلار و برای هر میلیون توکن خروجی 2.19 دلار هزینه دارد.
دسترسی به R1
علاقه مندان میتوانند به صورت رایگان از طریق پلتفرم چت DeepSeek، که مشابه ChatGPT است، با نام DeepThink از این هوش مصنوعی استفاده کنند. همچنین وزن های مدل و کد منبع آن تحت مجوز MIT از طریق Hugging Face در دسترس هستند. توسعه دهندگان میتوانند برای ادغام مستقیم از API نیز استفاده کنند.
چرا R1 مهم است؟
معرفی R1 نشان میدهد که مدلهای متنباز هوش مصنوعی در حال کاهش فاصله خود با مدلهای تجاری بسته هستند. این موضوع میتواند به دموکراتیزه شدن هوش مصنوعی و افزایش نوآوری در این حوزه کمک کند.
نظرات در مورد : هوش مصنوعی DeepSeek، رقیب سر سخت o1 OpenAI