Meta Luncurkan LLaMA, Alat Penelitian Pesaing OpenAI GPT-3

Perbesar

Baca berita dengan sedikit iklan, klik di sini

TEMPO.CO, Jakarta - Setelah Open AI ChatGPT membawa revolusi, Google meluncurkan BARD, dan beberapa lainnya mengikuti, kini Meta bersiap untuk memiliki keunggulan dibandingkan rekan-rekannya. Raksasa teknologi yang berbasis di California ini telah memperkenalkan alat baru yang akan segera membantu membangun chatbot berbasis AI, sebagaimana dilaporkan Indian Express.

Baca berita dengan sedikit iklan, klik di sini

Perusahaan telah secara terbuka merilis Large Language Model Meta AI (LLaMA). Menurut rilis resmi, LLaMA adalah model bahasa dasar canggih yang dikembangkan untuk membantu peneliti dalam pekerjaan mereka di subbidang AI. Menariknya, ini akan menjadi LLM ketiga Meta setelah Glactica dan Blender Bot 3 yang segera ditutup setelah hasil yang salah.

Apa itu LLaMA?

LLaMA pada dasarnya bukanlah sebuah chatbot; ia adalah alat penelitian yang, menurut Meta, kemungkinan besar akan memecahkan masalah terkait model bahasa AI. “Model yang lebih kecil dan lebih berkinerja seperti LLaMA memungkinkan orang lain dalam komunitas riset yang tidak memiliki akses ke infrastruktur dalam jumlah besar untuk mempelajari model ini, semakin mendemokratisasi akses di bidang penting yang cepat berubah ini,” kata Meta dalam blog resminya .

Baca berita dengan sedikit iklan, klik di sini

LLaMA adalah kumpulan model bahasa yang berkisar dari parameter 7B hingga 65B. Perusahaan telah mengatakan bahwa mereka melatih modelnya pada triliunan token dan mengklaim bahwa adalah mungkin untuk melatih model canggih menggunakan kumpulan data publik dan tidak bergantung pada kumpulan data eksklusif dan tidak dapat diakses.

Apa perbedaan LLaMA?

Menurut Meta, melatih model dasar yang lebih kecil seperti LLaMA sangat ideal karena membutuhkan daya komputasi dan sumber daya yang sangat rendah untuk menguji, memvalidasi, dan mengeksplorasi kasus penggunaan baru. Model bahasa dasar diketahui melatih potongan besar data yang tidak berlabel dan ini membuatnya ideal untuk disesuaikan menurut berbagai tugas. Meta mengatakan akan menawarkan LLaMA dalam ukuran seperti parameter 7B, 13B, 33B, dan 65B.

BACA JUGA

Minta X Buka Kantor di Indonesia, Menkominfo: Meta, Google dan Lainnya Sudah Punya Perwakilan

Pengamat Dorong Media Massa Perbanyak Model Bisnis Agar Tak Bergantung Iklan

Dalam makalah penelitiannya, Meta mencatat bahwa LLaMA-13B mengungguli GPT-3 OpenAI (175B) pada sebagian besar tolok ukur dan LLaMA-65B bersaing dengan model terbaik, Chinchilla70B dari DeepMind dan PaLM-540B dari Google. Setelah terlatih sepenuhnya, LLaMA-13B dapat menjadi keuntungan bagi usaha kecil yang ingin menjalankan pengujian pada sistem ini, namun, mungkin masih jauh dari isolasi kerja peneliti.

LLaMA saat ini tidak digunakan pada produk Meta mana pun, namun perusahaan memiliki rencana untuk menyediakannya bagi para peneliti. Perusahaan sebelumnya telah meluncurkan LLM OPT-175B tetapi LLaMA adalah sistem yang lebih maju. Meta juga telah menyediakan kode sumber model LLaMA bagi orang luar untuk melihat cara kerja sistem. Ini akan memungkinkan mereka menyesuaikan dan berkolaborasi dalam proyek terkait.

Mendekode Model Bahasa Besar

Model bahasa besar atau LLM adalah sistem AI yang mengonsumsi teks digital dalam jumlah besar dari sumber internet seperti artikel, laporan berita, dan postingan media sosial. Teks digital ini digunakan untuk melatih perangkat lunak yang memprediksi dan menghasilkan konten dari awal berdasarkan petunjuk dan kueri. Model-model ini dapat membantu dalam tugas-tugas seperti menulis esai, membuat postingan media sosial, menyarankan kode pemrograman, dan menghasilkan percakapan chatbot.