Breaking News:

Fakta DeepSeek, AI China Bikin Was-was ChatGPT, 10 Kali Lipat Lebih Murah Dibanding Produk OpenAI

Fakta-fakta DeepSeek, AI baru asal China yang menjadi pesaing berat ChatGPT 10 kali lebih murah dibanding produk OpenAI

|
SouthChinaMorningPost
DEEPSEEK - Fakta-fakta DeepSeek, AI baru asal China yang menjadi pesaing berat ChatGPT yang 10 kali lebih murah dibanding produk OpenAI 

Biaya pengembangan yang lebih murah bisa terjadi karena DeepSeek dilatih menggunakan chip AI atau GPU yang lebih murah, Nvidia H800. Sementara itu, GPT-4o dikembangkan menggunakan chipset Nvidia H100 dengan harga dan spesifikasi yang lebih tinggi.

AI China DeepSeek tidak bisa mendapatkan chip AI terbaru dan canggih seperti Nvidia H100, yang diproduksi perusahaan AS. Hal ini dikarenakan AS menerapkan pembatasan ekspor chip AI ke berbagai negara, terutama negara yang dianggap berbahaya seperti China.

Selain jenis chip yang lebih murah, jumlah chip AI yang digunakan untuk melatih DeepSeek juga lebih efisien. DeepSeek hanya dilatih menggunakan 2.048 unit GPU Nvidia H800. Sementara itu, latihan GPT-4 bisa menggunakan hingga puluhan ribu unit Nvidia H100.

8. Lebih hemat sumber daya dan efektif

DeepSeek mengadopsi pendekatan teknologi inovatif untuk memastikan efisiensi dan performa tinggi dalam model AI mereka. DeepSeek dikembangkan dengan metode Mixture-of-Experts (MoE) dan Chain of Thought (CoT).

MoE adalah arsitektur yang memungkinkan model besar, seperti DeepSeek V3, dengan total 671 miliar parameter, untuk hanya mengaktifkan 37 miliar parameter saat memproses setiap token. Metode ini membuat model lebih hemat sumber daya tanpa mengorbankan kinerja.

Kemudian, DeepSeek-R1 dilatih menggunakan teknik Chain-of-Thought (CoT), yang memecah pertanyaan kompleks menjadi langkah-langkah kecil sebelum memberikan jawaban akhir.

Dengan CoT, model tidak hanya menghasilkan respons yang lebih logis dan akurat, tetapi juga mampu mengidentifikasi dan memperbaiki kesalahan logika atau halusinasi data selama proses berpikirnya.

9. Unggul di sejumlah platform benchmark

Dengan biaya yang lebih efisien, kemampuan DeepSeek ternyata sangat memukau. Model AI China DeepSeek diklaim dapat mengungguli kemampuan model-model AI lain, seperti Claude dari Atrophic, Llama dari Meta, dan GPT dari Open AI, di beberapa benchmark.

Pada benchmark uji coba pemahaman terhadap konteks (DROP, 3-shot F1), misalnya, DeepSeek V3 diklaim memiliki skor performa 91,6 poin, lebih tinggi dari Llama 3.1, Claude 3.5, dan GPT-4o yang masing-masing memiliki skor 88,7, 88,3, dan 83,7 poin.

Kemudian, untuk memecahkan soal matematika level internasional, seperti AIME 2024, MATH-500, hingga CNMO 2024, DeepSeek V3 memiliki skor performa untuk masing-masing benchmark mencapai 39,2, 90,2, dan 43,2 poin.

Di benchmark serupa, Llama 3.1, Claude-3.5, dan GPT-4o masing-masing memiliki skor performa AIME 2024, MATH-500, dan CNMO 2024 mencapai 23,3, 73,8, dan 6,8 poin; 16,0, 78,3, dan 13,1 poin; serta 9,3, 74,6, dan 10,8 poin.

DeepSeek juga mengklaim bahwa DeepSeek-R1 mampu menyaingi dan bahkan melampaui model AI terbaru dari OpenAI, yaitu OpenAI O1, di beberapa benchmark, termasuk dalam tes pemahaman konteks dan pemecahan masalah matematika.

10. Memanfaatkan talenta dalam negeri

Pengembangan DeepSeek sepenuhnya memanfaatkan talenta muda dalam negeri. Wenfeng mengatakan, inovasi AI tidak tidak harus mempekerjakan talenta yang memiliki kemampuan sangat bagus di bidang AI dari luar China.

Karyawan DeepSeek diklaim semuanya berasal dari dalam negeri. DeepSeek mengambil lulusan baru dari kampus-kampus ternama di China dan talenta muda dalam negeri yang telah berpengalaman di bidang AI.

Wenfeng menyadari jika talenta dalam negeri yang sangat ahli di bidang AI mungkin belum ada saat ini. Akan tetapi, dia berencana untuk mendidik talenta dalam negeri agar bisa bersaing dengan talenta AI papan atas.

11. DeepSeek dibuat open source

Halaman
1234
Sumber: Kompas.com
Tags:
DeepSeekChinaChatGPTOpenAI
Berita Terkait
AA

BERITA TERKINI

© 2025 TRIBUNnews.com Network,a subsidiary of KG Media.
All Right Reserved