Baca berita dengan sedikit iklan, klik di sini

Digital

DeepSeek V3 Tantang ChatGPT dan Meta: Unggul dalam Bahasa, Pemrograman, dan Matematika

DeepSeek V3 menampilkan pemahaman yang kuat terhadap konsep numerik, dan mengaplikasikan teori matematika.

21 Maret 2025 | 03.00 WIB

Ilustrasi deepseek. Reuters/Dado Ruvic
Perbesar
Ilustrasi deepseek. Reuters/Dado Ruvic

Baca berita dengan sedikit iklan, klik di sini

TEMPO.CO, Jakarta - DeepSeek V3 hadir sebagai pesaing kuat di dunia kecerdasan buatan, menantang model artificial intelligence (AI) besar seperti ChatGPT, Claude-3.5, hingga Meta.

Baca berita dengan sedikit iklan, klik di sini

Pada laman situsnya, DeepSeek V3 memecahkan terobosan baru dalam kecepatan menarik kesimpulan dibandingkan versi sebelumnya. Dalam hasil benchmark terbaru, aplikasi chatbot berbasis kecerdasan buatan ini berhasil meraih skor unggul di berbagai kategori.

Baca berita dengan sedikit iklan, klik di sini

slot-iklan-300x600

Pencapaian tersebut ditunjang oleh arsitektur Mixture of Experts (MoE). Chatbot ini membuktikan kemampuannya sebagai AI yang dapat bersaing dengan raksasa teknologi. Pada hasil benchmark chatbot ini unggul terhadap pemrosesan bahasa, terutama bahasa Inggris. Chatbot ini meraih respon yang lebih cepat, hal ini dibuktikan dari skor 88,5 pada MMLU (EM) dan 89,1 di MMLU-Redux (EM), mengungguli ChatGPT pada beberapa aspek.

Selain memenangkan kemampuan proses bahasa Inggris, AI ini juga menampilkan dominasi pada bahasa Mandarin dengan skor 86,5 pada C-Eval (EM) dan 64.1 di C-SimpleQA yang mengalahkan kompetitornya. Sebagai AI, chatbot ini unggul dalam memahami tata bahasa dan struktur kalimat yang kompleks untuk berbagai kebutuhan linguistik.

Chatbot dengan versi terbarunya ini juga lihai dalam pemrograman dengan kemampuan memahami dan menyelesaikan kode pemrograman secara efisien. Selain itu AI ini juga memberikan jawaban yang akurat untuk berbagai perintah pengkodean.

Dengan AI ini, pengembang dapat mengoptimalkan algoritma serta meningkatkan efisiensi waktu. Hal ini diklaim melalui pembuktian uji benchmark HumanEval-Mul (Pass@1) dengan skor 82.6 dan LiveCodeBench (Pass@1-COT) di angka 40.5, mengalahkan pesaingnya yaitu ChatGPT dan Meta.

Tidak sampai disitu, DeepSeek V3 menampilkan pemahaman yang kuat terhadap konsep numerik, dan mengaplikasikan teori matematika. Chatbot ini memiliki kemampuan yang optimal dalam menyusun langkah-langkah logis, sehingga dapat menyelesaikan soal matematika dengan akurasi tinggi. Pada hasil tes uji, AI ini mendapatkan skor skor 90.2 dalam MATH-500 (EM) dan 43.2 pada CNMO 2024 (Pass@1).

Hasil uji ini membuat DeepSeek berani unjuk gigi terhadap kompetitornya, Meta dan ChatGPT kalah telak pada uji matematika. Dengan menoreh kemenangan pada 13 uji benchmark. DeepSeek V3 menunjukkan perkembangan pesat dalam kecerdasan buatan.

Meskipun menoreh kemenangan terhadap 13 uji, termasuk kemampuan AI dalam bahasa Inggris, pengkodean, matematika hingga bahasa Mandari, chatbot ini masih kalah dalam beberapa kategori. Seperti SWE Verified (Resolved) dan GPQA-Diamond, memperlihatkan bahwa masih ada indikator untuk penyempurnaan, terutama dalam pemahaman dan pemecahan masalah kompleks.

Dianka Rinya Fitriansyah berkontribusi dalam artikel ini.
Pilihan editor: Biar Tak Kalah dari Deepseek, OpenAI dan Google Minta Ini ke Donald Trump

close

Baca berita dengan sedikit iklan, klik di sini

Logo Tempo
Unduh aplikasi Tempo
download tempo from appstoredownload tempo from playstore
Ikuti Media Sosial Kami
© 2024 Tempo - Hak Cipta Dilindungi Hukum
Beranda Harian Mingguan Tempo Plus