Syarikat permulaan kecerdasan buatan (AI) China, DeepSeek, telah mengemas kini model AI versi V4 terbaharu, meningkatkan kelajuan inferens sehingga 85% pada tahap maksimum, sambil mengurangkan kos penyebaran secara ketara.
Mengikut laporan Wallstreetcn dan IT Home, DeepSeek pada hari Sabtu (27 Jun) telah mengemas kini versi V4, memperkenalkan rangka kerja spekulatif decoding (Speculative Decoding) DSpark, serta membuka sumber alat penuh DeepSpec.
DeepSeek-V4-Pro-DSpark bukanlah model dengan seni bina baru sepenuhnya, tetapi ia memperkenalkan modul spekulatif decoding berdasarkan DeepSeek-V4-Pro. Oleh itu, kemas kini kali ini lebih menumpukan pada pelaksanaan kejuruteraan, dan bukannya peningkatan keupayaan model itu sendiri.
Speculative decoding ialah satu teknologi yang boleh meningkatkan kecekapan inferens tanpa menjejaskan hasil output model. Teknologi ini membenarkan model ringan untuk menjana kandungan calon terlebih dahulu, kemudian disahkan oleh model utama untuk mempercepatkan kelajuan inferens model bahasa besar (LLM).
DeepSpec ialah alat sumber terbuka lengkap untuk melatih dan menilai model draf speculative decoding, termasuk penyediaan data, latihan model, pelaksanaan model draf dan penilaian prestasi. Alat ini membantu penyelidik melatih model speculative decoding secara langsung dan menurunkan ambang penyebaran dengan ketara.
Menurut makalah yang diterbitkan oleh pengasas DeepSeek, Liang Wenfeng, bersama Universiti Peking, penyebaran DSpark dalam sistem perkhidmatan dalam talian DeepSeek-V4 dan dijalankan dalam persekitaran trafik pengguna sebenar dapat mengurangkan pembaziran kuasa pengkomputeran akibat pengesahan tidak sah.
Berbanding dengan penyelesaian penanda aras persekitaran pengeluaran sedia ada, DSpark boleh meningkatkan kelajuan penjanaan untuk pengguna individu antara 60% hingga 85% pada throughput yang sama.
Ini adalah hasil pertama DeepSeek dalam bidang pengoptimuman kecekapan inferens AI selepas mengumpul pembiayaan sebanyak 50 bilion yuan RMB (sekitar S$9.53 bilion). Ini menunjukkan bahawa selain memberi tumpuan kepada peningkatan keupayaan model, syarikat permulaan ini juga berusaha untuk memperoleh kelebihan dalam persaingan kecekapan kuasa pengkomputeran.
Pada masa ini, model AI yang dibangunkan syarikat China sedang menuju arah prestasi tinggi, kos rendah dan kecekapan ringan, satu trend yang sedang menggugat dominasi syarikat Amerika Syarikat yang telah bertahan lama.
Laporan Bloomberg menyatakan, menurut data OpenRouter, sehingga Jun tahun ini, bahagian permintaan token yang dihantar kepada model Google, OpenAI dan Anthropic telah menurun dengan ketara dari 72% setahun lalu kepada 33%; manakala sehingga Mac, bahagian model AI China telah meningkat melebihi 60%.
Salah satu faktor utama yang menyumbang kepada lonjakan kadar penggunaan model AI China adalah kelebihan nisbah prestasi kepada kos berbanding model Amerika Syarikat.