JAMBI, Portalone.net – Raksasa teknologi Google kembali membuat gebrakan di ajang konferensi pengembang tahunan Google I/O 2026 yang diselenggarakan di Mountain View, California, Selasa (19/5/2026) waktu setempat atau Rabu (20/5/2026) WIB. Pada perhelatan ini, Google secara resmi memperkenalkan Gemini Omni, model kecerdasan buatan (AI) teranyar yang mengusung konsep revolusioner “any-to-any”.
Konsep “any-to-any” memungkinkan sistem AI ini menerima hampir seluruh format masukan (input)—mulai dari teks, gambar, audio, hingga video—untuk kemudian dilebur dan diubah menjadi bentuk konten yang sama sekali baru.
Melalui keterangan di blog resminya, Google memaparkan bahwa Gemini Omni merupakan langkah evolusi dari Nano Banana, model AI terdahulu yang berfokus pada pengeditan dan pembuatan gambar. Melalui Omni, Google secara ambisius memperluas kemampuan multimodal tersebut ke ranah pembuatan video generatif.
“Dengan Omni, Anda dapat menggabungkan gambar, audio, video, dan teks sebagai input untuk menghasilkan video berkualitas tinggi yang didukung oleh pengetahuan dunia nyata milik Gemini,” tulis perwakilan Google.
Mengedit Video Semudah Mengobrol
Daya tarik utama yang ditawarkan Gemini Omni adalah kemudahan dalam mengedit video. Pengguna tidak lagi membutuhkan perangkat lunak penyuntingan yang rumit, melainkan cukup mengetikkan perintah menggunakan bahasa alami (natural language) layaknya sedang mengobrol via aplikasi pesan.
AI akan secara otomatis menyesuaikan isi video dengan instruksi yang diberikan. Menariknya, sistem ini dibekali memori yang kuat untuk mengingat seluruh rentetan instruksi. Hal ini memastikan bahwa karakter, objek, maupun atmosfer dalam video tetap konsisten meskipun pengguna melakukan revisi berulang kali. Pengguna dapat dengan mudah melakukan hal-hal kompleks, seperti mengubah patung dalam video menjadi gelembung, menyisipkan karakter baru, atau mengubah sebuah adegan secara drastis.
Untuk mendukung visual yang realistis, Google mengeklaim Gemini Omni dibekali dengan pemahaman hukum fisika yang jauh melampaui pendahulunya. Sistem AI ini mampu memahami dan menyimulasikan gravitasi, energi kinetik, hingga dinamika fluida (zat cair) secara akurat. Dipadukan dengan basis pengetahuan Gemini mengenai sejarah dan sains, video yang dihasilkan tidak hanya tampak nyata, tetapi juga logis. Kemampuan ini bahkan memungkinkan Omni untuk memproduksi video penjelasan (explainer videos) terkait konsep-konsep rumit hanya bermodalkan prompt singkat.
Fitur Avatars dan Penanda Digital SynthID
Selain pengeditan objek dan ruang, Gemini Omni turut memperkenalkan fitur Avatars. Melalui fitur ini, pengguna dapat memindai wajah dan suara mereka sendiri untuk menciptakan avatar digital. Avatar tersebut nantinya dapat digunakan untuk memproduksi video AI dengan wujud dan suara yang identik dengan pengguna aslinya.
Menyadari potensi risiko penyalahgunaan teknologi ini, Google menerapkan standar keamanan yang ketat. Seluruh video yang dihasilkan oleh Gemini Omni akan disematkan watermark digital SynthID. Penanda kasatmata ini berfungsi untuk memverifikasi keaslian video, di mana pengguna dapat mengecek apakah sebuah konten merupakan hasil buatan AI atau bukan melalui aplikasi Gemini, ekstensi Gemini di Chrome, maupun Google Search.
Ketersediaan Gemini Omni Flash
Sebagai pembuka dari keluarga model Omni, Google secara resmi merilis Gemini Omni Flash ke publik. Ketersediaan layanan ini diatur dalam beberapa fase:
-
Saat Ini: Tersedia secara global bagi pelanggan berbayar Google AI Plus, Pro, dan Ultra melalui aplikasi Gemini dan ekosistem Google Flow.
-
Pekan Ini: Digulirkan tanpa biaya tambahan bagi pengguna platform YouTube Shorts dan aplikasi YouTube Create.
-
Dalam Beberapa Minggu ke Depan: Akses akan dibuka bagi kalangan pengembang (developers) dan pelanggan tingkat perusahaan (enterprise) melalui integrasi API.
