Pasukan saintis China buat pertama kali mengesahkan bahawa model bahasa besar multimodal berasaskan teknologi kecerdasan buatan mampu membentuk sistem representasi konsep objek yang sangat serupa dengan manusia secara spontan, iaitu kecerdasan buatan boleh menghasilkan kognisi bertaraf manusia secara spontan.
Menurut laporan SinoCast, kajian ini telah diselesaikan bersama oleh pasukan pengkomputeran neural dan interaksi otak-mesin di Institut Automasi Akademi Sains China, serta pasukan Pusat Inovasi Cemerlang Sains Otak dan Teknologi Pintar Akademi Sains China, dan keputusan kajian berkaitan telah diterbitkan pada 9 hari bulan dalam jurnal akademik profesional antarabangsa "Nature Machine Intelligence".
Diperkenalkan bahawa manusia mampu membuat konsep objek dalam alam semula jadi, dan kebolehan kognitif ini telah lama dianggap sebagai teras kepintaran manusia. Apabila orang melihat "anjing", "kereta" atau "epal", mereka bukan sahaja boleh mengenal pasti ciri fizikal mereka (saiz, warna, bentuk, dll.), tetapi juga memahami fungsinya, nilai emosional dan makna budaya, dan representasi konsep pelbagai dimensi ini menjadi asas kognisi manusia.
Dalam beberapa tahun kebelakangan ini, dengan perkembangan model bahasa besar seperti ChatGPT, persoalan asas sama ada model besar ini boleh membangunkan representasi konsep objek mirip manusia dari bahasa dan data multimodal juga telah muncul.
Dalam kajian ini, pasukan penyelidik mereka bentuk satu set paradigma inovatif yang menggabungkan pemodelan pengkomputeran, eksperimen tingkah laku dan sains otak, yang berasaskan teori klasik sains saraf kognitif.
Pasukan penyelidik mengekstrak 66 "dimensi minda" daripada data tingkah laku model besar yang sangat besar dan memberi label semantik kepada dimensi ini. Kajian mendapati bahawa dimensi ini adalah sangat boleh diterangkan dan ketara berkait dengan pola aktiviti neural di kawasan pilihan kategori otak.
Pasukan penyelidik seterusnya membandingkan keseragaman pola pilihan tingkah laku pelbagai model dengan manusia, dan hasil menunjukkan bahawa model besar multimodal menunjukkan prestasi lebih baik dalam aspek keseragaman. Di samping itu, kajian ini juga mendedahkan bahawa dalam membuat keputusan, manusia lebih cenderung untuk menggabungkan ciri visual dan maklumat semantik dalam menilai, manakala model besar cenderung bergantung kepada label semantik dan konsep abstrak.
Penemuan kajian menunjukkan bahawa model bahasa bukan sekadar "burung nuri rawak", tetapi mengandungi pemahaman yang mirip manusia terhadap konsep dunia nyata, dengan penemuan teras bahawa "dimensi minda" kecerdasan buatan mencapai tujuan yang sama dengan cara yang berbeza seperti manusia.