به گزارش بخش اخبار فناوری زوم تک ,غول جستجوگر دنیای وب، گوگل، در تازه ترین به روز رسانی هوش مصنوعی خود، قابلیت کاربردی و جذابی را به کاربران هدیه داده است. دیگر نیازی نیست برای به اشتراک گذاشتن خاطرات یا ایده های بصری خود، تک تک تصاویر را آپلود کنید. هوش مصنوعی گوگل حالا از آپلود همزمان چندین عکس پشتیبانی میکند، امکانی که فرآیند تعامل با این ابزار قدرتمند را به مراتب سریع تر و لذت بخش تر خواهد کرد. این قابلیت جدید، درهای تازهای را به روی خلق محتوا، تحلیل بصری و سازماندهی تصاویر به کمک هوش مصنوعی میگشاید.
قابلیت جدید جمنای پیشرفته: آپلود همزمان چند عکس، گامی در رقابت با ChatGPT
دنیای هوش مصنوعی با سرعتی شگفت انگیز در حال پیشرفت است و دستیار های هوشمند مبتنی بر این فناوری، روز به روز جایگاه مهم تری در زندگی دیجیتال ما پیدا می کنند. در میان انبوه این دستیار ها، جمنای (Gemini) محصول گوگل و ChatGPT توسعه یافته توسط OpenAI، به عنوان دو رقیب اصلی و پرطرفدار شناخته می شوند که هر کدام با قابلیت ها و ویژگی های منحصر به فرد خود، کاربران خاصی را به سوی خود جلب کرده اند. رقابت تنگاتنگ میان این دو غول فناوری، منجر به ارائه مداوم قابلیت های جدید و بهبود یافته می شود و کاربران نهایی، برندگان اصلی این رقابت هستند.
اخیرا، گزارش هایی منتشر شده که نشان می دهد گوگل در حال افزودن قابلیتی کاربردی به نسخه پولی دستیار هوش مصنوعی خود، یعنی جمنای پیشرفته (Gemini Advanced) است؛ قابلیتی که پیش از این در ChatGPT وجود داشت و حالا به نظر می رسد جمنای نیز در صدد ارائه آن برآمده است: امکان آپلود همزمان چندین عکس.
شواهد اولیه و جزئیات فاش شده
اولین نشانه های این قابلیت جدید، با انتشار یک اسکرین شات توسط یکی از کاربران شبکه اجتماعی ردیت (Reddit) آشکار شد. این تصویر، محیط کاربری نسخه تحت وب جمنای پیشرفته را نشان می دهد که در آن، کاربر قادر به بارگذاری چندین فایل تصویری به طور همزمان است. نکته جالب توجه این است که طبق اطلاعات موجود در اسکرین شات، این قابلیت از طریق مدل هوش مصنوعی Gemini 2.0 Flash، که یکی از مدل های بهینه و سریع در دسترس کاربران پیشرفته است، ارائه می شود.
این اتفاق نشان می دهد که گوگل در تلاش است تا توانایی های بصری جمنای را گسترش داده و آن را به ابزاری قدرتمندتر برای تحلیل و تعامل با محتوای تصویری تبدیل کند. امکان پردازش همزمان چند عکس می تواند کاربرد های متنوعی داشته باشد، از مقایسه محصولات در تصاویر مختلف گرفته تا دریافت تحلیل ترکیبی از چند نمودار یا سند تصویری.
محدودیت دسترسی و برنامه های آینده گوگل
با وجود انتشار این خبر هیجان انگیز، به نظر می رسد قابلیت آپلود همزمان چند عکس هنوز در مراحل اولیه پیاده سازی قرار دارد. در حال حاضر، این ویژگی تنها برای تعداد محدودی از کاربران نسخه پولی جمنای (Gemini Advanced) فعال شده و کاربران نسخه رایگان هنوز به آن دسترسی ندارند. حتی در میان کاربران اشتراکی نیز، به نظر می رسد این قابلیت به صورت تدریجی در حال فعال سازی است و هنوز برای تمامی حساب های پولی در دسترس قرار نگرفته است.
این رویکرد تدریجی در انتشار قابلیت های جدید، امری معمول در دنیای نرم افزار است و به شرکت ها اجازه می دهد تا بازخورد کاربران اولیه را جمع آوری کرده و پیش از عرضه عمومی، مشکلات احتمالی را برطرف کنند.
نکته قابل ذکر دیگر این است که پیش از این، گزارش هایی مبنی بر مشاهده امکان بارگذاری چندین تصویر در نسخه اندروید اپلیکیشن جمنای منتشر شده بود. این موضوع، گمانه زنی ها مبنی بر اینکه گوگل قصد دارد این قابلیت را به زودی برای تمام پلتفرم ها (وب، اندروید، iOS) و احتمالا برای تمام کاربران (شاید با محدودیت هایی برای نسخه رایگان) ارائه دهد، تقویت می کند.
اهمیت قابلیت چند تصویری در دنیای هوش مصنوعی
افزودن امکان پردازش همزمان چند تصویر، گامی مهم در راستای تبدیل جمنای به یک دستیار هوش مصنوعی چند وجهی (Multimodal) واقعی است. هوش مصنوعی چند وجهی قادر است انواع مختلفی از داده ها مانند متن، تصویر، صدا و ویدیو را به طور همزمان درک و پردازش کند. این توانایی، دستیار های هوش مصنوعی را قادر می سازد تا وظایف پیچیده تری را انجام داده و تعاملات طبیعی تری با کاربران داشته باشند.
تصور کنید بتوانید چندین عکس از زوایای مختلف یک محصول را آپلود کرده و از جمنای بخواهید آن را با محصول دیگری مقایسه کند، یا چندین نمودار مربوط به یک گزارش را بارگذاری کرده و خلاصه ای تحلیلی از آن ها دریافت کنید. این ها تنها نمونه هایی از کاربرد های بالقوه قابلیت آپلود همزمان چند عکس هستند که می توانند بهره وری کاربران را به طور قابل توجهی افزایش دهند.
همگام با رقبا و فراتر از آن
ارائه این قابلیت توسط جمنای، پاسخی مستقیم به رقیب اصلی خود، ChatGPT، محسوب می شود که مدتی است از این ویژگی پشتیبانی می کند. گوگل با افزودن این امکان، نه تنها فاصله خود را با رقیب کمتر می کند، بلکه نشان می دهد که در زمینه توسعه قابلیت های بصری هوش مصنوعی، برنامه های جدی در سر دارد.
علاوه بر آپلود چند عکس، گوگل اخیرا قابلیت های ویرایش تصویر پیشرفته ای را نیز به جمنای اضافه کرده است. هفته گذشته بود که امکان ویرایش تصاویری که توسط خود هوش مصنوعی تولید شده اند و همچنین تصاویری که توسط کاربر آپلود می شوند، در نسخه وب و اپلیکیشن موبایل جمنای فعال شد. این قابلیت به کاربران اجازه می دهد تا با استفاده از دستورات متنی، تغییراتی مانند حذف یا جایگزینی اشیاء در تصویر، تغییر پس زمینه، افزودن عناصر جدید و سایر ویرایش های خلاقانه را به راحتی انجام دهند. ترکیب قابلیت آپلود چند عکس با ابزار های ویرایش تصویر قدرتمند، جمنای را به پلتفرمی جذاب برای تولید کنندگان محتوا، طراحان و کاربرانی که با محتوای بصری سروکار دارند، تبدیل می کند.
نتیجه گیری: آینده روشن تعامل بصری با هوش مصنوعی
افزودن قابلیت آپلود همزمان چند عکس به جمنای پیشرفته، خبری امیدوار کننده برای کاربران این دستیار هوشمند است و نشان دهنده تعهد گوگل به توسعه مداوم و بهبود تجربه کاربری آن است. اگرچه این ویژگی هنوز به صورت عمومی در دسترس نیست، اما شواهد موجود حاکی از آن است که به زودی شاهد حضور گسترده تر آن در پلتفرم های مختلف خواهیم بود. این قابلیت، در کنار سایر پیشرفت های اخیر در زمینه پردازش و ویرایش تصویر، جمنای را در مسیر تبدیل شدن به یک ابزار هوش مصنوعی چند وجهی قدرتمند قرار داده و رقابت در این عرصه را بیش از پیش داغ می کند. باید منتظر ماند و دید که کاربران چگونه از این قابلیت های جدید استقبال خواهند کرد و گوگل در آینده چه نوآوری های دیگری را برای جمنای به ارمغان خواهد آورد.
نظرات در مورد : هوش مصنوعی گوگل، آلبومگردانی را آسان تر کرد؛ آپلود دستهای تصاویر، قابلیتی جدید برای خلق تجربه های بصری