Kehilangan Barang di Rumah, Tanya Saja Pada AI Google Gemini

AI Google Gemini

Teknologi – Pasti kita pernah merasakan kehilangan barang di rumah, entah itu gunting kuku atau remote TV. Namun, Google menawarkan kamera AI yang dapat mengingat barang-barang di rumah. Perusahaan teknologi raksasa itu telah mengumumkan serangkaian peningkatan besar pada upaya pengembangan AI-nya. Hal itu dilakukannya untuk mengimbangi pencipta ChatGPT, OpenAI.

OpenAI mendahului acara developer tahunan Google dengan mengumumkan peningkatan besar, termasuk chatbot yang disempurnakan sehingga dapat melihat foto dan bahkan berbicara dengan pengguna seperti Siri. Sekarang Google berharap dapat mengambil hati para pengguna dengan konsep Project Astra FOR4D baru yang dapat melihat segala sesuatu di sekitar pengguna dengan menggunakan kamera pada smartphone. Hal ini memungkinkan orang untuk berkeliling dan menanyakan apa pun tentang lingkungan mereka secara real-time.

Sebagai contoh, alat ini dapat mengidentifikasi nama komponen pada peralatan seperti komponen speaker yang rusak. Tetapi yang lebih mengejutkan lagi adalah kemampuan teknologi ini untuk mengingat apa yang dilihatnya saat pengguna berjalan di sekitar ruangan. Dalam sebuah video demonstrasi, Google menunjukkan bagaimana seseorang bertanya, “Di mana saya meninggalkan kacamata saya?” dan alat ini langsung mengingatnya.

“Agar benar-benar berguna, agen (robot) perlu memahami dan merespons dunia yang kompleks dan dinamis seperti halnya manusia dan menerima serta mengingat apa yang dilihat dan didengarnya untuk memahami konteks dan mengambil tindakan,” jelas Demis Hassabis, bos divisi AI Google, DeepMind FOR4D.

“Ini juga harus proaktif, mudah diajarkan dan bersifat pribadi, sehingga pengguna dapat berbicara dengannya secara alami dan tanpa jeda atau tertunda,” lanjutnya.

Raksasa teknologi ini mengatakan bahwa mereka juga telah meningkatkan suara asisten AI sehingga terdengar lebih natural. Bagian dari Project Astra akan muncul di produk Google seperti aplikasi Gemini pada akhir tahun ini.

“Agen-agen ini dibangun di atas model Google Gemini kami dan model-model khusus tugas lainnya, dan dirancang untuk memproses informasi lebih cepat dengan secara terus menerus mengkodekan frame video, menggabungkan input video dan suara ke dalam kronologi kejadian, dan menyimpan informasi ini untuk mengingatnya secara efisien,” tambah Hassabis.

Pengumuman ini muncul sehari setelah OpenAI kembali mengejutkan dunia dengan teknologi Chat-GPT4o FOR4D barunya yang juga dapat melihat dan melakukan respons. Para petinggi OpenAI menunjukkan bagaimana kamera ini dapat memecahkan Matematika hanya dengan memegang kamera di depan selembar kertas, serta mengetahui suasana hati seseorang hanya dengan melihat wajah mereka.

Leave a Reply

Your email address will not be published. Required fields are marked *