تنها یک روز پس از معرفی آخرین نسخه از GPT-4o توسط OpenAI و اپلیکیشن رومیزی چت جیپیتی، گوگل با چندین خبر هیجانانگیز وارد میدان شد. غول فناوری مانتین ویو در رویداد Google I/O 2024 اعلام کرد که مدل محبوب جمینی به گوگل فوتوز اضافه میشود.
به نظر میرسد کار با جمینی فوقالعاده است، حداقل دمو آن اینطور نشان میدهد. شما میتوانید از چتبات هوش مصنوعی هر سوالی در مورد عکسهایتان بپرسید و آن میتواند محتوای عکسها را درک کند. در دموی ارائه شده، جینی توانست مسیر یادگیری شنا کردن دخترتان یا حتی خواندن شماره پلاک ماشینها را درک کند.
قابلیت جمینی در گوگل فوتوز، جایی که روزانه ۶ میلیارد عکس و ویدیو آپلود میشود، با استفاده از ویژگیهای چندوجهی جینی برای خواندن متن در تصاویر، امسال تابستان عرضه خواهد شد. این قابلیت «بپرس از عکسها» نام دارد و از تواناییهای جمینی در پردازش چندرسانهای استفاده میکند. اما اگر نگران این هستید که جمینی اطلاعات عکسهایتان را ذخیره کند، گوگل اعلام کرده است که مگر در موارد سوءاستفاده یا آسیب، پرسشهای شما توسط انسان بررسی نخواهند شد.
مدیرعامل گوگل، سوندار پیچای، اعلام کرد که بیش از ۱.۵ میلیون توسعهدهنده از جمینی استفاده کردهاند.
مدتی پیش از رویداد I/O، گوگل بزرگترین بهروزرسانی جمینی را با مدل جمینی ۱.۵ و نسخه حرفهای آن عرضه کرد. جمینی ۱.۵ با عملکرد بسیار بهبودیافته، کارایی بهتری را با یک میلیون توکن ارائه میدهد، در حالی که GPT-4 توربوی OpenAI دارای ۱۲۸ هزار توکن و کلود ۲.۱ دارای ۲۰۰ هزار توکن است.
سال گذشته گوگل در رویداد I/O ۲۰۲۳ از گوشی پیکسل فولد با صفحهنمایش اولد جلویی ۵.۸ اینچی محافظتشده توسط گوریلا گلس ویکتوس و صفحهنمایش ۷.۶ اینچی در حالت باز شده رونمایی کرد. قیمت این گوشی ۱۷۹۹ دلار بود.