Meta Umumkan Llama 4 yang Diklaim Lebih Efisien daripada DeepSeek-V3

Perbesar

Logo Meta. Dok. Shutterstock

Baca berita dengan sedikit iklan, klik disini

TEMPO.CO, Jakarta - Chief Excecutive Officer Meta Mark Zuckerberg mengumumkan dua model kecerdasan buatan atau AI terbaru dari versi Llama 4. Model yang diumumkan adalah Llama 4 Scout, dan Llama 4 Maverick yang diklaim lebih efisien daripada DeepSeek-V3 milik DeepSeek.

Baca berita dengan sedikit iklan, klik disini

“Hari ini, kami meluncurkan dua model Llama 4 open source pertama. Kami punya dua lagi yang sedang dalam perjalanan,” kata Mark dalam unggahan video di akun Facebook-nya, Ahad, 6 April 2025.

Baca berita dengan sedikit iklan, klik di sini

Mark menjelaskan, Llama 4 Scout merupakan model parameter aktif dengan 17 miliar parameter dan 16 pakar. Model ini memiliki konteks panjang hingga 10 juta token atau unit dasar dari teks yang diproses oleh model bahasa.

BACA JUGA

Minta X Buka Kantor di Indonesia, Menkominfo: Meta, Google dan Lainnya Sudah Punya Perwakilan

Pengamat Dorong Media Massa Perbanyak Model Bisnis Agar Tak Bergantung Iklan

Kemudian pada model Llama 4 Maverick disebut kinerjanya lebih tinggi dengan 17 miliar parameter oleh 128 pakar. Mark mengklaim model ini lebih baik daripada GPT-4o milik OpenAI dan Gemini Flash 2 milik Google. “Lebih kecil dan lebih efisien daripada DeepSeek-V3, dirancang untuk berjalan pada satu host untuk memudahkan inferensi (hasil proses),” ujarnya.

DeepSeek-V3, Llama 4 Scout dan Llama 4 Maverick sama-sama model bahasa besar (Large Language Model) dalam AI untuk memahami, memproses, dan menjawab teks.

BACA JUGA

Facebook Rilis Desain Baru untuk Menggaet Gen Z Saat Konsumen Remaja AS Menurun

Model AI Meta Movie Gen dan Update Tanggul Pantai Jakarta di Top 3 Tekno

Model DeepSeek-V3 lebih dulu dirilis pada 26 Desember 2024. Model AI buatan perusahaan asal Cina tersebut menggunakan arsitektur Mixture-of-Experts (MoE) dengan total 671 miliar parameter, di mana 37 miliar parameter diaktifkan untuk setiap token selama proses inferensi. MoE juga sama-sama digunakan oleh Llama 4 Maverick.

Berdasarkan perbandingan Meta, DeepSeek masih lebih unggul di bagian Live Code Bench dengan skor 45.8/49.2, sedangkan Llama 4 Maverick 43.4. DeepSeek juga unggul di MMLU (Massive Multitask Language Understanding) Pro dan GPQA (Graduate-Level Physics Questions and Answers) Diamond.

Llama 4 Maverick lebih unggul pada pengeluaran per 1 juta input dan output token, Massive Multi-discipline Multi-choice Understanding (MMMU), MathVista, ChartQA, dan DocVQA.

Mark mengatakan dua model Llama 4 yang menyusul diluncurkan adalah Llama 4 Reasoning dan Llama 4 Behemoth. Model ini juga diklaim akan menjadi model dasar dengan performa tertinggi di dunia. “Masih banyak yang harus dilakukan, tetapi arahnya sudah jelas, kami akan segera merilis lebih banyak model,” tuturnya.

Meta meluncurkan model Llama pertama kali pada 2023. Setelah itu Llama dikembangkan menjadi Llama 2, Llama 3, dan saat ini Llama 4.

Pilihan Editor: Ratu Sampah Yakin Banjarmasin Bisa Atasi Kondisi Darurat dalam 2 Bulan. Ini Caranya