DeepSeek V3 Tantang ChatGPT dan Meta: Unggul dalam Bahasa, Pemrograman, dan Matematika

material-symbols:fullscreenPerbesar

Ilustrasi deepseek. Reuters/Dado Ruvic

Baca berita dengan sedikit iklan, klik disini

TEMPO.CO, Jakarta - DeepSeek V3 hadir sebagai pesaing kuat di dunia kecerdasan buatan, menantang model artificial intelligence (AI) besar seperti ChatGPT, Claude-3.5, hingga Meta.

Baca berita dengan sedikit iklan, klik disini

Pada laman situsnya, DeepSeek V3 memecahkan terobosan baru dalam kecepatan menarik kesimpulan dibandingkan versi sebelumnya. Dalam hasil benchmark terbaru, aplikasi chatbot berbasis kecerdasan buatan ini berhasil meraih skor unggul di berbagai kategori.

Baca berita dengan sedikit iklan, klik di sini

Pencapaian tersebut ditunjang oleh arsitektur Mixture of Experts (MoE). Chatbot ini membuktikan kemampuannya sebagai AI yang dapat bersaing dengan raksasa teknologi. Pada hasil benchmark chatbot ini unggul terhadap pemrosesan bahasa, terutama bahasa Inggris. Chatbot ini meraih respon yang lebih cepat, hal ini dibuktikan dari skor 88,5 pada MMLU (EM) dan 89,1 di MMLU-Redux (EM), mengungguli ChatGPT pada beberapa aspek.

BACA JUGA

Timbang-timbang Donald Trump Akan Larang Pemakaian DeepSeek di AS

Audit NewsGuard: DeepSeek Hanya Capai Akurasi 17 Persen, Tertinggal dari Pesaing AI Lainnya

Selain memenangkan kemampuan proses bahasa Inggris, AI ini juga menampilkan dominasi pada bahasa Mandarin dengan skor 86,5 pada C-Eval (EM) dan 64.1 di C-SimpleQA yang mengalahkan kompetitornya. Sebagai AI, chatbot ini unggul dalam memahami tata bahasa dan struktur kalimat yang kompleks untuk berbagai kebutuhan linguistik.

Chatbot dengan versi terbarunya ini juga lihai dalam pemrograman dengan kemampuan memahami dan menyelesaikan kode pemrograman secara efisien. Selain itu AI ini juga memberikan jawaban yang akurat untuk berbagai perintah pengkodean.

Dengan AI ini, pengembang dapat mengoptimalkan algoritma serta meningkatkan efisiensi waktu. Hal ini diklaim melalui pembuktian uji benchmark HumanEval-Mul (Pass@1) dengan skor 82.6 dan LiveCodeBench (Pass@1-COT) di angka 40.5, mengalahkan pesaingnya yaitu ChatGPT dan Meta.

BACA JUGA

DeepSeek vs ChatGPT, Mana Chatbot AI yang Lebih Canggih? Ini Hasil Pengujian Ringkas Tempo

DeepSeek Geser ChatGPT, Jadi Aplikasi Nomor Satu di App Store dan Play Store

Tidak sampai disitu, DeepSeek V3 menampilkan pemahaman yang kuat terhadap konsep numerik, dan mengaplikasikan teori matematika. Chatbot ini memiliki kemampuan yang optimal dalam menyusun langkah-langkah logis, sehingga dapat menyelesaikan soal matematika dengan akurasi tinggi. Pada hasil tes uji, AI ini mendapatkan skor skor 90.2 dalam MATH-500 (EM) dan 43.2 pada CNMO 2024 (Pass@1).

Hasil uji ini membuat DeepSeek berani unjuk gigi terhadap kompetitornya, Meta dan ChatGPT kalah telak pada uji matematika. Dengan menoreh kemenangan pada 13 uji benchmark. DeepSeek V3 menunjukkan perkembangan pesat dalam kecerdasan buatan.

Meskipun menoreh kemenangan terhadap 13 uji, termasuk kemampuan AI dalam bahasa Inggris, pengkodean, matematika hingga bahasa Mandari, chatbot ini masih kalah dalam beberapa kategori. Seperti SWE Verified (Resolved) dan GPQA-Diamond, memperlihatkan bahwa masih ada indikator untuk penyempurnaan, terutama dalam pemahaman dan pemecahan masalah kompleks.

Dianka Rinya Fitriansyah berkontribusi dalam artikel ini.
Pilihan editor: Biar Tak Kalah dari Deepseek, OpenAI dan Google Minta Ini ke Donald Trump

deepseek

deepseek-adalah

chatgpt