Microsoft Luncurkan DALL-E 3 text-to-pic OpenAI ke Bing
Signaltodays.com_Microsoft telah mengintegrasikan model text-to-image terbaru OpenAI DALL-E 3 ke dalam layanan Bing Image Creator dan Chat, dan akan menambahkan tanda air tak terlihat yang menunjukkan tanggal dan waktu gambar pertama kali dibuat dan mencatatnya sebagai buatan AI.
“Model DALL-E 3 dari OpenAI menghadirkan peningkatan yang meningkatkan kualitas dan detail gambar secara keseluruhan, serta akurasi yang lebih baik untuk tangan manusia, wajah, dan teks dalam gambar,” demikian pengumuman OS-slinger.Para ahli telah lama memperingatkan tentang risiko alat AI generatif seperti DALL-E 3 digunakan untuk membuat disinformasi dan gambar palsu.
Microsoft mencoba mengatasi masalah tersebut pada bulan Juli, ketika mereka bergabung dengan pengembang AI terkemuka lainnya – termasuk Amazon, Anthropic, Google, Inflection, Meta, dan OpenAI – untuk menciptakan teknik watermarking yang mendeteksi dan memberi label pada konten yang dihasilkan AI.Hasil dari kolaborasi tersebut belum terlihat, namun Microsoft mencatat bahwa semua gambar yang dihasilkan AI yang dibuat oleh Bing Image Creator akan menambahkan tanda air digital yang tidak terlihat sesuai dengan spesifikasi C2PA – kerangka kerja teknis untuk memverifikasi asal konten, yang dibuat oleh Adobe, Arm, Intel, Microsoft dan Truepic.
Microsoft juga mengumumkan bahwa sistem moderasi konten yang diterapkan pada Bing bertujuan untuk mencegah DALL-E 3 membuat gambar berbahaya atau tidak pantas yang menggambarkan ketelanjangan, kekerasan, perkataan yang mendorong kebencian, atau aktivitas terlarang.
DALL-E 3 dilaporkan lebih baik dalam mengurai perintah masukan dan menghasilkan gambar yang mencerminkan keinginan pengguna dibandingkan sistem sebelumnya. Tidak seperti model sebelumnya, model ini menggunakan ChatGPT untuk secara otomatis menyesuaikan dan menyesuaikan permintaan pengguna untuk membuat gambar berkualitas lebih tinggi.
Bing AI juga telah menambahkan teknologi pemrosesan gambar lainnya. Pada bulan Juli, Microsoft meluncurkan fitur Pencarian Visual Multimodal, yang memungkinkan pengguna menyertakan gambar dalam perintah mereka. Didukung oleh model GPT-4 OpenAI, layanan ini kemudian dapat melakukan hal-hal seperti mengenali atau menjawab pertanyaan tentang objek di foto.
Salah satu pengguna rupanya berhasil mengelabui sistem agar membaca karakter dalam CAPTCHA dengan melapisi gambar teks masukan yang diperlukan pada gambar kalung. Pengguna kemudian meminta Bing AI untuk membaca pesan tersebut, mengklaim bahwa kalung tersebut adalah hadiah dari kerabat yang baru saja meninggal.
Microsoft sadar bahwa teknologi text-to-image menghadirkan tantangan.
“Kami memiliki tim besar yang bekerja untuk mengatasi masalah ini dan masalah serupa. Sebagai bagian dari upaya ini, kami mengambil tindakan dengan memblokir situs web yang mencurigakan dan terus meningkatkan sistem kami untuk membantu mengidentifikasi dan memfilter jenis permintaan ini sebelum masuk ke dalam model,” a Juru bicara Microsoft mengatakan kepada The Register dalam sebuah pernyataan.“Seperti biasa, kami mendorong pelanggan untuk mempraktikkan kebiasaan baik saat online, termasuk berhati-hati saat memberikan informasi pribadi yang sensitif.