Baca berita dengan sedikit iklan, klik di sini

Digital

Meta Umumkan Llama 4 yang Diklaim Lebih Efisien daripada DeepSeek-V3

Chief Excecutive Officer Meta Mark Zuckerberg menyatakan, dua model Llama 4 lainnya akan menyusul,

6 April 2025 | 12.04 WIB

Logo Meta. Dok. Shutterstock
Perbesar
Logo Meta. Dok. Shutterstock

Baca berita dengan sedikit iklan, klik di sini

TEMPO.CO, Jakarta - Chief Excecutive Officer Meta Mark Zuckerberg mengumumkan dua model kecerdasan buatan atau AI terbaru dari versi Llama 4. Model yang diumumkan adalah Llama 4 Scout, dan Llama 4 Maverick yang diklaim lebih efisien daripada DeepSeek-V3 milik DeepSeek.

Baca berita dengan sedikit iklan, klik di sini

“Hari ini, kami meluncurkan dua model Llama 4 open source pertama. Kami punya dua lagi yang sedang dalam perjalanan,” kata Mark dalam unggahan video di akun Facebook-nya, Ahad, 6 April 2025.

Baca berita dengan sedikit iklan, klik di sini

slot-iklan-300x600

Mark menjelaskan, Llama 4 Scout merupakan model parameter aktif dengan 17 miliar parameter dan 16 pakar. Model ini memiliki konteks panjang hingga 10 juta token atau unit dasar dari teks yang diproses oleh model bahasa.

Kemudian pada model Llama 4 Maverick disebut kinerjanya lebih tinggi dengan 17 miliar parameter oleh 128 pakar. Mark mengklaim model ini lebih baik daripada GPT-4o milik OpenAI dan Gemini Flash 2 milik Google. “Lebih kecil dan lebih efisien daripada DeepSeek-V3, dirancang untuk berjalan pada satu host untuk memudahkan inferensi (hasil proses),” ujarnya.

DeepSeek-V3, Llama 4 Scout dan Llama 4 Maverick sama-sama model bahasa besar (Large Language Model) dalam AI untuk memahami, memproses, dan menjawab teks.

Model DeepSeek-V3 lebih dulu dirilis pada 26 Desember 2024. Model AI buatan perusahaan asal Cina tersebut menggunakan arsitektur Mixture-of-Experts (MoE) dengan total 671 miliar parameter, di mana 37 miliar parameter diaktifkan untuk setiap token selama proses inferensi. MoE juga sama-sama digunakan oleh Llama 4 Maverick.

Berdasarkan perbandingan Meta, DeepSeek masih lebih unggul di bagian Live Code Bench dengan skor 45.8/49.2, sedangkan Llama 4 Maverick 43.4. DeepSeek juga unggul di MMLU (Massive Multitask Language Understanding) Pro dan GPQA (Graduate-Level Physics Questions and Answers) Diamond.

Llama 4 Maverick lebih unggul pada pengeluaran per 1 juta input dan output token, Massive Multi-discipline Multi-choice Understanding (MMMU), MathVista, ChartQA, dan DocVQA.

Mark mengatakan dua model Llama 4 yang menyusul diluncurkan adalah Llama 4 Reasoning dan Llama 4 Behemoth. Model ini juga diklaim akan menjadi model dasar dengan performa tertinggi di dunia. “Masih banyak yang harus dilakukan, tetapi arahnya sudah jelas, kami akan segera merilis lebih banyak model,” tuturnya.

Meta meluncurkan model Llama pertama kali pada 2023. Setelah itu Llama dikembangkan menjadi Llama 2, Llama 3, dan saat ini Llama 4.

M. Faiz Zaki

Menjadi wartawan di Tempo sejak 2022. Lulus dari Program Studi Antropologi Universitas Airlangga Surabaya. Biasa meliput isu hukum dan kriminal.

close

Baca berita dengan sedikit iklan, klik di sini

Logo Tempo
Unduh aplikasi Tempo
download tempo from appstoredownload tempo from playstore
Ikuti Media Sosial Kami
© 2024 Tempo - Hak Cipta Dilindungi Hukum
Beranda Harian Mingguan Tempo Plus