به گزارش بخش اخبار فناوری زوم تک , ChatGPT، ربات هوشمند و پرطرفدار OpenAI، بار دیگر با قابلیتی نوظهور خبرساز شده است. کاربران شبکه های اجتماعی به تازگی ترندی را به راه انداختهاند که در آن از ChatGPT برای یافتن موقعیت مکانی عکس های مختلف استفاده میکنند. این قابلیت جدید، در عین جذابیت و کاربردهای بالقوه، نگرانی هایی را نیز در مورد حریم خصوصی افراد به وجود آورده است.
چشمان تیزبین هوش مصنوعی: مدل های جدید OpenAI مکان شما را از روی عکس حدس می زنند؛ زنگ خطری برای حریم خصوصی؟
پیشرفت های شگرف در حوزه هوش مصنوعی مولد، قابلیت های جدید و گاه حیرت انگیزی را به نمایش می گذارد. در تازه ترین تحول، به نظر می رسد مدل های استدلالی جدید شرکت OpenAI توانایی قابل توجهی در تحلیل تصاویر و استنتاج موقعیت مکانی آن ها پیدا کرده اند. این قابلیت که به سرعت در حال تبدیل شدن به یک ترند در میان کاربران است، نگرانی های جدی را در مورد حفظ حریم خصوصی افراد برانگیخته است.
معرفی مدل های جدید با قدرت استدلال بصری بالا
شرکت OpenAI که پیشگام توسعه مدل های زبانی بزرگ مانند ChatGPT است، مدتی پیش از جدیدترین دستاوردهای خود در زمینه هوش مصنوعی، یعنی مدل های o3 و o4-mini (نام هایی که اخیرا مطرح شده اند)، رونمایی کرد. ویژگی برجسته این مدل های نوین، توانایی خارق العاده آن ها در استدلال و تحلیل محتوای بصری تصاویر است. این مدل ها قادرند تصاویر بارگذاری شده را به دقت بررسی کنند، بخش هایی از آن را برش دهند، بچرخانند، بزرگنمایی کنند و به تحلیل جزئیات بپردازند. نکته قابل توجه این است که این قدرت تحلیل حتی در مورد تصاویر نه چندان واضح، تار یا حتی مخدوش نیز صدق می کند.
ترکیب تحلیل تصویر و جستجوی وب: ابزاری قدرتمند برای مکان یابی
قابلیت تحلیل عمیق تصاویر، هنگامی که با توانایی این مدل ها برای جستجو در وب ترکیب می شود، ابزاری بسیار قدرتمند و کارآمد برای شناسایی موقعیت مکانی عکس ها ایجاد می کند. گزارش ها و نمونه های منتشر شده در شبکه های اجتماعی، به ویژه ایکس (توییتر سابق)، نشان می دهد که مدل o3 در تشخیص شهرها، مکان های دیدنی و تاریخی، رستوران ها، کافه ها و بارها با دقت بسیار بالایی عمل می کند. این مدل می تواند با شناسایی المان های کلیدی در تصویر – مانند نام خیابان، تابلوی مغازه ها، سبک معماری، پوشش گیاهی، پلاک خودروها یا حتی جزئیات کوچکی در پس زمینه – و تطبیق آن ها با اطلاعات موجود در وب، موقعیت جغرافیایی عکس را با درصد موفقیت بالایی حدس بزند.
جالب اینجاست که در بسیاری از موارد گزارش شده، به نظر نمی رسد که این مدل ها برای رسیدن به پاسخ، از تاریخچه گفتگوهای قبلی کاربر در ChatGPT یا داده های EXIF عکس ها (اطلاعات فراداده ای که معمولا شامل زمان، تاریخ و گاه موقعیت مکانی ثبت عکس است) استفاده کرده باشند. این موضوع نشان می دهد که توانایی اصلی در تحلیل خود تصویر و اطلاعات بصری آن نهفته است.
روند نگران کننده: بازی GeoGuessr با عکس های شخصی
کاربران در شبکه های اجتماعی مثال های متعددی از این قابلیت را به اشتراک گذاشته اند. آن ها تصاویری از منوی رستوران ها، نماهایی از کوچه و خیابان های محله خود، عکس هایی از ساختمان های مختلف و حتی سلفی هایی که در مکان های عمومی گرفته اند را به ChatGPT می دهند و از مدل o3 می خواهند تا مانند بازی محبوب GeoGuessr عمل کند. GeoGuessr یک بازی آنلاین است که بازیکنان را به چالش می کشد تا تنها با دیدن تصاویری از سرویس Google Street View، موقعیت مکانی آن ها را روی نقشه جهان حدس بزنند. حالا به نظر می رسد هوش مصنوعی در حال تبدیل شدن به یک رقیب جدی در این بازی، حتی با استفاده از عکس های شخصی کاربران است.
نقض حریم خصوصی: خطری آشکار و جدی
اما فراتر از جنبه سرگرمی یا کنجکاوی، مسئله بسیار مهم و نگران کننده نقض حریم خصوصی مطرح می شود. هیچ مانع فنی یا محدودیت جدی وجود ندارد که فردی با نیت سوء، به سادگی از استوری اینستاگرام، پست فیسبوک یا هر عکس دیگری که فردی به صورت آنلاین به اشتراک گذاشته، اسکرین شات بگیرد و سپس با استفاده از ChatGPT و مدل های جدید آن، موقعیت مکانی دقیق آن فرد را شناسایی کند. این امر می تواند پیامدهای خطرناکی مانند تعقیب، آزار و اذیت، داکسینگ (افشای عمومی اطلاعات شخصی و خصوصی فرد بدون رضایت او) یا حتی برنامه ریزی برای سرقت و سایر جرایم را به دنبال داشته باشد.
مقایسه با مدل های قبلی و محدودیت ها
البته باید اشاره کرد که قابلیت تشخیص مکان از روی عکس، پدیده ای کاملا جدید نیست. مدل های قبلی مانند GPT-4o نیز تا حدی قادر به انجام این کار بودند و می توانستند با دقت و سرعت قابل قبولی موقعیت برخی عکس ها را شناسایی کنند. با این حال، گزارش ها حاکی از آن است که دو مدل جدید o3 و o4-mini در برخی موارد خاص و چالش برانگیز، عملکرد بهتری نسبت به نسل های پیشین خود دارند.
به عنوان مثال، در یک نمونه گزارش شده، کاربران عکسی از سر تزئینی یک کرگدن که در محیط کم نور یک بار گرفته شده بود را به هر دو مدل GPT-4o و o3 ارائه دادند. در حالی که GPT-4o نتوانست مکان را تشخیص دهد، مدل جدیدتر o3 موفق به شناسایی صحیح بار شد. این نشان می دهد که توانایی تحلیل جزئیات ظریف و استنتاج در شرایط نوری نامناسب در مدل های جدید بهبود یافته است. از طرف دیگر، برخی کاربران نیز گزارش داده اند که مدل o3 در همه موارد موفق عمل نمی کند و گاهی در تشخیص مکان درست دچار اشتباه می شود. این نشان می دهد که این قابلیت هنوز کامل نیست اما به سرعت در حال پیشرفت است.
سیاست های OpenAI و آینده نامعلوم
آنچه بر نگرانی ها می افزاید، این است که به نظر می رسد شرکت OpenAI محدودیت های چندانی برای استفاده از این قابلیت مکان یابی در مدل های جدیدش اعمال نکرده است. در حالی که این شرکت معمولا برای جلوگیری از سوء استفاده، محدودیت هایی را برای تولید محتوای مضر یا نقض کننده حریم خصوصی در مدل های خود قرار می دهد، به نظر می رسد در مورد تشخیص مکان از روی عکس، این محدودیت ها کمتر یا ناکافی هستند.
این موضوع می تواند در آینده به یک چالش قانونی و اخلاقی جدی برای OpenAI تبدیل شود و باید منتظر ماند و دید که این شرکت چه سیاست هایی را برای کنترل و مدیریت این قابلیت قدرتمند و بالقوه خطرناک اتخاذ خواهد کرد. آیا شاهد اعمال محدودیت های بیشتر خواهیم بود یا مسئولیت استفاده صحیح از این ابزار بر عهده کاربران گذاشته خواهد شد؟ پاسخ به این سوال، تاثیر مهمی بر آینده تعامل ما با هوش مصنوعی و حفظ حریم خصوصی در عصر دیجیتال خواهد داشت.
نظرات در مورد : ترند شوکآور ChatGPT: فاش شدن موقعیت مکانی تصاویر با هوش مصنوعی