Alibaba Cloud Luncurkan Model AI Image Generation Tongyi Wanxiang, Apa Keunggulannya?

Alibaba Cloud Luncurkan Model AI Image Generation Tongyi Wanxiang, Apa Keunggulannya? - Alibaba Cloud, tulang punggung teknologi digital dan inteligensi milik Alibaba Group, hari ini meluncurkan model penghasil gambar berbasiskan AI (AI Generation Model) terbarunya, Tongyi Wanxiang ('Wanxiang' berarti 'puluhan ribu gambar') di World Artificial Intelligence Conference 2023. Versi mutakhir dari model AI generative ini sekarang tersedia untuk perusahaan di Tiongkok untuk pengujian beta terbatas.

Selain itu, pionir cloud ini mengumumkan peluncuran ModelScopeGPT, kerangka kerja serbaguna yang dirancang untuk membantu pengguna dalam menyelesaikan fungsi AI yang kompleks dan spesifik di berbagai bidang mulai dari bahasa, vision, dan percakapan dengan memanfaatkan beragam model AI di ModelScope. ModelScope adalah platform Model-as-a-Service (MaaS) sumber terbuka (open-source) yang diperkenalkan oleh Alibaba Cloud tahun lalu, yang dilengkapi lebih dari 900 model AI.

“Tongyi Wanxiang merepresentasikan pencapaian signifikan lainnya dari usaha kami dalam mengembangkan model AI generative paling canggih sebagaimana kami terus mengeksplorasi teknologi pengubah paradigma yang memperkuat bisnis dan komunitas agar maksimal mengeluarkan kreativitas dan produktivitas," kata Jingren Zhou, CTO Alibaba Cloud Intelligence.

"Dengan dirilisnya Tongyi Wanxiang, ilustrasi gambar berkualitas tinggi dari generative AI akan lebih mudah diakses, berkontribusi pada pengembangan seni AI yang inovatif dan ekspresi kreatif bagi bisnis di berbagai sektor, termasuk e-commerce, game, desain, dan periklanan."

Memperkenalkan Tongyi Wanxiang sebagai Image Generation

Model AI generatif ini piawai dalam menjalankan berbagai fungsi, merespons perintah teks dalam bahasa Mandarin dan Inggris untuk menghasilkan gambar yang mendetail dalam berbagai gaya, termasuk cat air, cat minyak, dan lukisan Tiongkok hingga animasi, sketsa, ilustrasi datar, dan kartun 3D. Selain itu, model ini dapat mengubah gambar apa pun menjadi gambar baru dengan gaya yang serupa dan menata gambar melalui proses transfer gaya dengan mempertahankan materi gambar asli sambil menerapkan gaya visual gambar lain.

Ditopang oleh teknologi inovatif Alibaba Cloud dalam manajemen wawasan, visual AI, dan natural language processing (NLP), model ini memanfaatkan beragam materi bahasa guna peningkatan uji coba. Model ini memiliki kemampuan pemahaman semantik yang mumpuni, sehingga menghasilkan gambar yang lebih akurat dan relevan secara kontekstual.

Selain itu, dengan mengoptimalkan proses kombinasi resolusi tinggi berdasarkan rasio signal-to-noise, model ini dapat menyeimbangkan antara keakuratan komposisi dan ketajaman detail sementara tetap meningkatkan kinerjanya demi menghasilkan gambar yang kontras dan memukau secara visual dengan latar belakang yang bersih.

Tongyi Wanxiang dikembangkan menggunakan Composer, model skala besar milik Alibaba Cloud dengan memberikan keleluasan mengontrol pada hasil akhir gambar, seperti tata letak spasial dan palet, dengan tetap mempertahankan kualitas sintesis gambar dan kreativitas.

Baca juga:Acer Aspire 7 Gaming A715-76G 54XS, Laptop Gaming Gahar Harga Pelajar

Beberapa contoh text-to-image yang dihasilkan oleh Tongyi Wanxiang:

Prompt: Visualisasikan lanskap kota pada senja hari, sebuah dunia yang memadukan arsitektur modern dengan estetika anime yang memikat.

Prompt: Pewarnaan abu-abu yang immersive, memikat, menampilkan seekor harimau di hutan mandala yang tenteram. Gambar ini tersusun dari garis dan sapuan kuas.

Prompt: Seorang anak berumur enam tahun manis yang mengenakan baju tradisional Hanfu bergaya Tiongkok menawan tampak dari depan rak baju, medium close-up, 85mm lens

Silakan lihat video demo Tongyi Wanxiang di sini: https://www.alizila.com/video/wach-how-alibaba-tongyi-wanxiang-creates-generative-ai-image/. Pelanggan perusahaan di Tiongkok dapat mengajukan permohonan pengujian beta terbatas Tongyi Wanxiang di situs web: https://wanxiang.aliyun.com

ModelScopeGPT Diluncurkan untuk Tugas AI yang Kompleks

Alibaba Cloud juga meluncurkan ModelScopeGPT (https://modelscope.cn/studios/damo/ModelScopeGPT/), sebuah framework berkemampuan tinggi yang dirancang untuk memanfaatkan kekuatan Model Bahasa Berskala Besar (Large Language Models) (LLM) yang tersedia di platform ini. ModelScopeGPT akan menggunakan LLMs sebagai pengendali untuk menghubungkan model pada keahlian bidang tertentu di komunitas open-source ModelScope.

Dikembangkan dalam ekosistem Model-as-a-Service yang lebih lengkap, ModelScopeGPT memaksimalkan berbagai kemampuan AI yang dimiliki oleh Alibaba Cloud. Perusahaan dan developer dapat memanfaatkan ModelScopeGPT secara gratis untuk mengakses dan menjalankan model yang paling sesuai untuk melakukan tugas-tugas AI yang kompleks sesuai kebutuhan pengguna, seperti mengembangkan video multibahasa.

Alibaba Cloud meluncurkan LLM bernama Tongyi Qianwen pada bulan April, dan berencana untuk mengintegrasikan LLM dengan berbagai bisnis Alibaba demi meningkatkan kualitas pengalaman pengguna di masa yang akan datang.

Pelanggan dan pengembang perusahaan juga akan memiliki akses ke model ini untuk membuat fitur AI yang dimodifikasi dengan metode yang hemat biaya. Sejak peluncuran model ini, lebih dari 300.000 permintaan pengujian beta terbatas telah diterima dari berbagai perusahaan dari berbagai sektor, termasuk fintech, elektronik, transportasi, fashion, dan produk susu.

Tongyi Qianwen juga telah terintegrasi ke dalam asisten cerdas Alibaba Cloud, Tingwu, yang memberikan kemampuan bagi asisten untuk memahami dan menganalisis konten multimedia dengan tingkat akurasi dan efisiensi yang tinggi. Lebih dari 360.000 pengguna telah mengakses asisten bertenaga AI ini sejak diluncurkan.

Kompetisi AI Hackathon untuk Memacu Hadirnya Inovasi

ModelScope juga menyelenggarakan AI Hackathon pertamanya di Tiongkok untuk memfasilitasi penerapan model AI pada skala industri, dengan hadiah uang tunai dan peluang pendanaan dari perusahaan modal ventura terkemuka sebagai insentif.

Dari lebih dari 300 tim yang berpartisipasi, 56 tim berhasil mencapai babak final. Para peserta berkompetisi untuk memperebutkan hadiah utama dalam dua kategori. Salah satunya adalah berinovasi pada Model Bahasa Berskala Besar (LLM) untuk memecahkan masalah sehari-hari. Kedua, memanfaatkan model yang sudah terlatih untuk menyelesaikan tugas yang diberikan, seperti pembuatan text-to-image generation atau menciptakan agen otonom yang ditopang sistem LLM dengan memanfaatkan model yang tepat untuk fungsi-fungsi tertentu.

"Dengan menyelenggarakan kompetisi dan acara komunitas terkait, kami ingin lebih banyak melibatkan developer dan pengusaha, dan mendorong mereka untuk mewujudkan ide-ide, memacu produktivitas, serta menciptakan alat AI yang lebih serbaguna yang dapat mengubah dan membentuk masa depan industri kita," ujar Jingren Zhou.