AI mendorong manusia digital "masuk ke dalam rumah tangga biasa"

Sejak dibuka pada bulan April 2025, Paviliun China di Pameran Dunia Osaka, Jepang telah menarik banyak pengunjung untuk "kehadiran harian". Ketika pengunjung memasuki Paviliun China, mereka bisa mendengar suara "Aku, Sun Wukong, datang!" dari jauh. Suara ini berasal dari "AI Sun Wukong" yang dibuat oleh iFLYTEK Co., Ltd. (selanjutnya disebut "iFLYTEK"), yang menguasai tiga bahasa: Mandarin, Jepang, dan Inggris, dengan penampilan dan suara yang meniru Sun Wukong dari film animasi klasik "Havoc in Heaven".

"AI Sun Wukong" di baliknya, adalah teknologi manusia digital yang berkembang pesat dalam beberapa tahun terakhir. Sebagai titik penghubung penting dalam industri baru seperti AI dan metaverse, peran manusia digital semakin penting dalam perkembangan ekonomi digital. Dengan penerapan mendalam teknologi model besar di bidang ini, manusia digital secara bertahap bergerak dari "dapat digunakan" menjadi "mudah digunakan", mendorong industri terkait memasuki tahap perkembangan baru.

Membentuk tiga kategori skenario aplikasi

Digital human adalah entitas digital cerdas yang diciptakan melalui berbagai teknologi kecerdasan digital seperti pemodelan. Ia memiliki penampilan, suara, dan bahasa manusia, mampu mensimulasikan gerakan tubuh, memiliki kemampuan berpikir, dan dapat mewujudkan fungsi belajar, menghasilkan, dan berinteraksi dengan dukungan model besar.

Dalam penggerak ganda teknologi dan permintaan, ekosistem industri manusia digital di negara kita semakin lengkap, skala aplikasi terus berkembang, dan kemampuan produksi, operasi, serta layanan di hulu dan hilir rantai industri secara bertahap meningkat. Data dari Tianyancha menunjukkan bahwa hingga 2024, jumlah perusahaan terkait manusia digital di negara kita telah mencapai 1,144,000, dengan lebih dari 174,000 perusahaan terdaftar baru hanya dalam 5 bulan pertama tahun 2024, yang menunjukkan potensi pasar dan vitalitas industri manusia digital.

Dalam pandangan anggota Dewan Konsultasi Ahli Asosiasi Internet Tiongkok, Wu Suoning, untuk menghindari teknologi manusia digital yang hanya bersifat formal dan menyebabkan pemborosan sumber daya, perlu menemukan saluran aplikasi, dan mempromosikan penerapan manusia digital secara menyeluruh.

Dengan aplikasi sebagai penggerak, industri manusia digital sedang mempercepat pembangunan ekosistem "teknologi—skenario—bisnis" yang tertutup.

Laporan "Pengembangan Digital Manusia di Tiongkok (2024)" yang dirilis oleh Asosiasi Internet Tiongkok (selanjutnya disebut "Laporan") menganalisis bahwa skenario aplikasi digital manusia saat ini telah membentuk tiga kategori utama: digital manusia media, digital manusia layanan, dan digital manusia industri. Di antara kategori tersebut, digital manusia media merupakan bentuk aplikasi digital manusia yang paling matang saat ini. Proporsi jumlah skenario yang dihasilkan oleh digital manusia media dapat mencapai 50%, dengan citra yang realistis dan ekspresi bahasa yang lancar, sangat meningkatkan interaktivitas dan daya tarik penyebaran informasi.

Misalnya, di "Perayaan Inovasi Teknologi Tiongkok" yang diadakan oleh Central Radio and Television Station pada tahun lalu, muncul pemandu acara Zhang Tengyue yang berduet dengan "AI Avatar". "AI Pemandu Acara" yang dibuat berdasarkan platform iFlytek Zhi Zuo milik iFlytek ini, tidak hanya memiliki suara, ekspresi, dan gerakan yang sama dengan pemandu acara nyata, tetapi juga dapat berkomunikasi dengan pemandu acara dengan tenang, memahami kata-kata satu sama lain dengan tepat, dan memberikan respon yang tepat dengan cepat, tingkat interaksi yang membuat penonton sulit membedakan antara yang asli dan yang palsu.

Laporan menunjukkan bahwa, selain media digital, layanan digital juga telah mengalami peningkatan yang menyeluruh, memiliki kemampuan interaksi yang lebih kuat, dengan proporsi jumlah skenario mencapai 30%, dan diterapkan secara luas di bidang pemerintahan, e-commerce, dan keuangan; sementara manusia digital industri mulai muncul, dengan proporsi jumlah skenario mencapai 20%, secara bertahap berperan dalam bidang kesehatan, pendidikan, dan manajemen perusahaan.

diharapkan menjadi pintu masuk inovasi AI

Digital humans secara umum telah mengalami tiga tahap, dari didorong oleh manusia nyata ke didorong oleh program, dan kini menjadi didorong oleh AI.

Meskipun pada awalnya digital manusia yang digerakkan oleh manusia nyata dapat menyajikan citra digital virtual, itu terutama bergantung pada pemodelan grafik komputer dan teknologi penangkapan gerakan, di baliknya tetap memerlukan manusia nyata untuk menyediakan banyak data bahasa, gerakan, dan lain-lain sebagai dukungan. Digital manusia yang digerakkan oleh program tidak lagi memerlukan data bahasa, gerakan, dan lain-lain yang disediakan oleh manusia nyata, tetapi berbasis pada program komputer tetap, lebih dekat dengan "robot digital", dan tidak dapat mencapai efek personifikasi dengan tingkat ketelitian yang tinggi. Dalam beberapa tahun terakhir, digital manusia yang digerakkan oleh AI tidak hanya semakin realistis dalam penyajian detail seperti pembacaan suara dan ekspresi gerakan, tetapi juga secara bertahap memiliki kemampuan interaksi dan pemikiran yang lebih kuat.

"Beberapa tahun yang lalu, manusia digital mungkin memiliki masalah seperti bentuk bibir dan ekspresi yang tidak cocok, serta gerakan yang kaku. Ini disebabkan oleh pemahaman manusia digital terhadap makna teks yang belum memadai, dan ekspresi serta gerakan sebagian besar bergantung pada sumber daya yang telah ditentukan sebelumnya yang terbatas, sehingga tidak dapat mencocokkan dengan konten teks secara akurat." kata Gao Jingwen, kepala bisnis manusia digital dari iFLYTEK, mengatakan bahwa dengan penerapan mendalam teknologi model besar di bidang manusia digital, kinerja produk manusia digital telah mencapai tingkat baru.

Misalnya, pada Oktober tahun lalu, iFLYTEK merilis manusia digital super-antropomorfik. Ini didasarkan pada generasi difusi multi-mode dari model besar, yang dapat menghasilkan gerakan tubuh secara real time sesuai dengan ritme, intonasi, dan konten ucapan, menerobos keterbatasan template preset tindakan dan sangat meningkatkan ekspresi manusia digital dalam adegan dinamis. Manusia digital Zhiying Tencent dapat mencapai "kloning gambar" dan "kloning suara", pengguna hanya perlu mengunggah sejumlah kecil gambar, video, dan materi audio, dan mereka dapat dengan cepat menghasilkan klon manusia digital mereka sendiri dan menyesuaikan timbre mereka. Manusia digital AI open-source Alibaba, EchoMimic, dapat memberikan ucapan dan ekspresi yang jelas pada gambar statis.

"Singkatnya, teknologi model besar tidak hanya bisa membuat manusia digital benar-benar memahami makna, tetapi juga dapat membuatnya dengan cepat menghasilkan tindakan dan ekspresi yang sesuai berdasarkan pemahaman teks, sehingga dapat sangat hidup." kata Gao Jingwen.

Ketua Asosiasi Internet Tiongkok, Shang Bing, percaya bahwa digital human sedang menjadi pintu masuk aplikasi AI yang aktif, dengan tingkat keterkaitan, keterbenaman, dan integrasi yang kuat dengan big data, terminal pintar, dan kecerdasan berbadan. Ini mungkin menjadi salah satu antarmuka interaksi aktif generasi berikutnya dari internet. Kita perlu memperhatikan praktik implementasi aplikasi inovatif, secara aktif menjelajahi digital human dan model bisnis baru lainnya, serta mempercepat pembentukan keunggulan aplikasi skala besar.

Wu Suoning juga percaya bahwa manusia digital adalah titik terobosan aplikasi AI dan pintu masuk inovasi AI. Manusia digital yang digerakkan oleh AI diharapkan dapat membawa aplikasi yang lebih beragam ke semua lapisan masyarakat, dan aplikasi ini dapat memandu AI ke jalur pengembangan pragmatis.

Menciptakan "perwujudan digital" yang personal

Dengan semakin luasnya penerapan manusia digital, banyak skenario yang menuntut manusia digital dengan persyaratan yang lebih tinggi.

"Misalnya, skenario seperti siaran langsung e-commerce dan Q&A layanan pelanggan mengedepankan persyaratan yang sangat tinggi untuk kemampuan interaksi real-time manusia digital. Manusia digital tidak hanya harus dapat melakukan percakapan waktu nyata dengan pengguna, tetapi juga menghasilkan tindakan dan ekspresi yang sesuai sesuai dengan konten dialog, jika tidak maka akan mempengaruhi efisiensi pemrosesan bisnis dan secara langsung mempengaruhi pengalaman pengguna. Gao Jingwen memperkenalkan bahwa untuk meningkatkan efisiensi model pembuatan video manusia digital, tim perusahaan telah mengembangkan teknologi ekstraksi representasi tindakan, yang mengubah input ucapan dan teks menjadi representasi perantara yang ringkas, secara efektif mengompresi dimensi video. Dengan bantuan teknologi ini, sistem dapat dengan cepat mengekstrak informasi penting dari teks dan suara input seperti stenografer, mengurangi jumlah data informasi yang tidak relevan, dan menghasilkan video yang sesuai, sangat meningkatkan efisiensi pembuatan video dan memastikan interaksi real-time antara manusia digital dan pengguna.

Perlu juga dicatat bahwa meskipun industri manusia digital berkembang pesat, namun masih dalam masa pertumbuhan yang pesat. Gao Jingwen percaya bahwa saat ini, ada fenomena homogenisasi produk manusia digital, dan personalisasi serta penyesuaian akan menjadi arah pengembangan penting dari industri manusia digital di masa depan. Dengan perkembangan teknologi AI generatif, ambang batas produksi dan biaya manusia digital telah berkurang dengan cepat, efisiensi produksi dan keragaman konten telah meningkat secara signifikan, dan telah menjadi kenyataan bagi pengguna untuk membuat produk manusia digital yang lebih dipersonalisasi sesuai dengan karakteristik mereka sendiri. Sekarang, manusia digital super-antropomorfik yang dipersonalisasi dapat dihasilkan hanya dengan foto, rekaman satu kalimat, dan materi lainnya, yang sangat menyederhanakan persyaratan untuk materi prasetel untuk kustomisasi manusia digital dan mengoptimalkan jalur operasi pengguna.

郜静文 juga mengakui, meskipun teknologi model besar sedang mendorong manusia digital "masuk ke dalam kehidupan sehari-hari", untuk mencapai efek yang lebih halus, masih perlu dilakukan banyak pemberian data dan pelatihan interaksi. Selain itu, masalah yang muncul seperti kebocoran privasi dan keamanan data tidak dapat diabaikan.

"Mungkin di masa depan setiap orang akan memiliki 'perwujudan digital', yang dapat membantu kita menangani pekerjaan, menjawab keraguan dalam kehidupan, dan menjadi teman kita." kata Gao Jingwen.

(Sumber: Harian Teknologi)

Sumber: Eastmoney

Penulis: Harian Teknologi

Lihat Asli
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate.io
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)