هاروارد و گوگل دست به دست هم دادهاند تا یک میلیون کتاب رایگان را در اختیار عموم قرار دهند! این خبر فوقالعاده برای محققان و توسعهدهندگان هوش مصنوعی است که میتوانند از این دادههای عظیم برای آموزش مدلهای زبان بزرگ خود استفاده کنند. آیا این اقدام باعث پیشرفت چشمگیر هوش مصنوعی خواهد شد؟ منتظر خبرهای بعدی باشید!
به گزارش زوم تک از VentureBeat، دادههای آموزشی هوش مصنوعی هزینه بالایی دارند و بیشتر مناسب شرکتهای فناوری ثروتمند هستند. به همین دلیل است که دانشگاه هاروارد قصد دارد مجموعهای از دادهها را منتشر کند که شامل حدود یک میلیون کتاب عمومی است که ژانرها، زبانها و نویسندگان مختلف از جمله دیکنز، دانته و شکسپیر را در بر میگیرد و به دلیل قدمتشان دیگر تحت حمایت حق چاپ نیستند.
این مجموعه دادههای جدید هنوز در دسترس نیست و مشخص نیست چه زمانی و چگونه منتشر خواهد شد. با این حال، این مجموعه شامل کتابهایی است که از پروژه قدیمی اسکن کتاب گوگل، Google Books، گرفته شده است و بنابراین گوگل در انتشار “این گنجینه عظیم” مشارکت خواهد داشت.
هاروارد برای اولین بار در ماه مارس از “ابتکار دادههای نهادی” (IDI) خود رونمایی کرد و برنامههای خود را برای ایجاد “یک مجرای مطمئن برای دادههای قانونی برای هوش مصنوعی” تشریح کرد. با این حال، تا زمان راهاندازی رسمی آن امروز، چیز زیادی از آن شنیده نشد، که با تایید اینکه IDI شامل حمایت مالی مایکروسافت و OpenAI است، همراه بود.
گرگ لپر، مدیر اجرایی IDI، میگوید که این مجموعه دادهها برای “ایجاد شرایط برابر” با در دسترس قرار دادن چنین مجموعه دادههای عظیمی برای هر کسی – از آزمایشگاههای تحقیقاتی گرفته تا استارتآپهای هوش مصنوعی – که میخواهند مدلهای زبان بزرگ (LLM) خود را آموزش دهند، طراحی شده است.
نظرات در مورد : هوش مصنوعی گوگل با خواندن یک میلیون کتاب هاروارد ، باهوشتر میشود!