Baca berita dengan sedikit iklan, klik di sini
DI jejaring sosial Twitter, setiap hari ada 400 juta tweet—tulisan pendek tak lebih dari 140 karakter—berlalu-lalang. Jumlah itu setara dengan 4.600 kicauan per detik yang dilontarkan oleh 200 juta pengguna aktif dari 500 juta akun yang terdaftar.
Tak lama lagi semua kicauan itu bisa dibaca oleh siapa pun. Adalah Perpustakaan Kongres Amerika Serikat yang membuat arsip dari setiap obrolan tersebut, menarik atau tidak, untuk dijadikan bahan penelitian.
Sejak online pada 2006, sudah ada sekitar 170 miliar tweet yang bertebaran di pelbagai penjuru dunia. Seandainya semua tweet itu dikumpulkan, dibutuhkan ruang penyimpan sebesar 133,2 terabita atau kira-kira 266 hard disk berkapasitas 500 gigabita.
Mengumpulkan semua tweet itu, yang berisi masalah serius sampai sekadar curahan hati para remaja tanggung, jelas bukan pekerjaan gampang. Tapi itulah yang dilakukan oleh Perpustakaan Kongres sejak 2010. Kurang kerjaan?
"Tidak juga. Arsip digital ini menyimpan pandangan hidup manusia masa kini dan akan digunakan sebagai bahan penelitian pada masa mendatang," kata James Hadley Billington, Kepala Perpustakaan Kongres Amerika Serikat, suatu ketika.
Nantinya data digital ini dimasukkan ke gudang arsip dan bisa diakses oleh peneliti dari mana saja. Tapi, ada syaratnya, satu kicauan hanya bisa digunakan jika umurnya sudah lebih dari enam bulan sejak ditulis oleh Tweeps—julukan bagi pengguna Twitter.
Untuk bisa menyedot dengan bebas koleksi Twitterverse (jagat Twitter) ini, Perpustakaan Kongres menjalin kerja sama dengan Twitter Incorporated pada 2010. Data Twitter tersebut akan menambah jumlah koleksi perpustakaan yang tergolong sangat komplet itu.
Hingga kini terdapat 155 juta arsip penting di Perpustakaan Kongres, antara lain buku, pamflet, peta, dan rekaman musik dari seluruh dunia. Ini membuat Perpustakaan Kongres sebagai bibliotek terbesar di dunia. Koleksi tertuanya adalah tablet Sumeria, cerita serangan Raja Amar Suen ke Kota Sasrum. Usianya sudah 4.000 tahun lebih.
Perpustakaan Kongres menganggap Twitter adalah salah satu saksi peristiwa penting di berbagai belahan dunia, dari pelantikan Presiden Amerika kulit hitam pertama, bencana gempa dan tsunami di Jepang, hingga perayaan anugerah Grammy.
Twitter juga dinilai sebagai rekaman komunikasi, reportase berita, dan tren sosial. Rekaman sejarah ini datang dari tangan pertama, laporan pandangan mata warga. Twitter juga menjadi pengumpul berita yang dilaporkan media massa.
Di negara yang aktif berkicau seperti Indonesia, Twitter dijejali oleh percikan ide dan laporan peristiwa. Tak jarang pula kicauan ini berisi laporan menu makan siang, keluh kemacetan, hingga kegalauan pribadi.
Di media sosial yang dibuat oleh Jack Dorsey pada Maret 2006 ini, informasi berharga—seperti halnya serangan Raja Sumeria—diciptakan setiap detik oleh warga dunia. Informasi peristiwa apa pun tak lepas dari pantauan Twitter.
Semiocast, perusahaan riset media sosial di Prancis, mencatat, hingga pertengahan tahun lalu, Amerika Serikat adalah negara paling aktif menggunakan Twitter. Total pemilik akun di sana mencapai 140 juta lebih. Setelah itu, Brasil (40 juta), Jepang (35 juta), dan Inggris (32 juta).
Indonesia di posisi kelima dengan 29 juta akun. Tapi, untuk urusan berkicau, orang Indonesia jagonya. Buktinya, Jakarta tercatat sebagai kota paling banyak menyumbang tweet setiap hari. Orang Bandung tak kalah aktif. Kota Kembang ada di posisi keenam, hanya kalah oleh Jakarta, Tokyo, London, Sao Paulo, dan New York.
Sejak awal Twitter dirancang sebagai ruang publik dengan komunikasi terbuka. Tapi ada juga pengguna yang keberatan pada aturan itu. Mereka lebih suka jika kicauan yang ditulis hanya bisa dibaca kerabat dekat.
Untuk alasan itu, Perpustakaan Kongres buru-buru memastikan pengarsipan dilakukan untuk kicauan terbuka saja. Kicauan yang telah dihapus juga tak akan masuk gudang arsip. Ini sangat penting. Sebab, satu tweet mengandung 50 informasi lain, seperti waktu, lokasi, biografi, dan rantai pertemanan. Informasi tersebut disimpan dalam bentuk metadata.
Untuk memindahkan data hingga hitungan terabita itu, Twitter menunjuk Gnip, perusahaan pengumpul data media sosial yang bermarkas di Boulder, Colorado. Perusahaan ini sudah berpengalaman mengumpulkan laporan pengguna 30 platform jejaring sosial, termasuk Twitter. Data Twitter pertama kali mengalir ke Perpustakaan Kongres pada Februari 2011.
Setelah terkumpul, data tersebut diawetkan. Hanya, data yang diambil dari Twitter masih bersifat mentah sehingga belum masuk ke rak arsip. Agar layak simpan, setiap kicauan yang baru datang diperiksa kelengkapan dan keutuhannya. Jika kurang lengkap, kicauan akan ditarik ulang dari server Twitter.
Setelah lulus pemeriksaan, kicauan disusun berdasarkan jam penerbitan dan dimasukkan ke tempat penyimpanan khusus. Sebagai media simpan, Perpustakaan Kongres memakai pita magnetik yang memiliki kapasitas besar dan sanggup bertahan untuk waktu lama.
Penulisan kicauan dilakukan pada pita utama dan pita cadangan, yang kemudian diletakkan di lokasi berbeda demi alasan keamanan. "Bisa dimuat ke dalam beberapa rak penyimpanan, tak sampai butuh ruangan sendiri," ujar Deputi Pustakawan Perpustakaan Kongres Robert Dizard.
Data Twitter banyak diminati para peneliti dari berbagai disiplin ilmu. Gunanya beragam, misalnya untuk melihat pola kemunculan jurnalisme warga, format komunikasi politik semasa pemilihan umum, prediksi pandemi flu, hingga ramalan pasar saham.
Supaya pencarian data mudah, kicauan diproses lalu dikelompokkan dalam beberapa kategori. Pengolahan data seperti ini pernah dilakukan Perpustakaan Kongres saat mengoleksi halaman yang mendokumentasikan kegiatan dan beleid pemerintah Amerika Serikat sejak 2000. Metode serupa akan dilakukan pada arsip Twitter.
Hanya, koleksi Twitter memiliki karakteristik unik. Jumlah kicauan begitu besar dan tersebar secara acak. Komputer penata kicauan yang dimiliki Perpustakaan Kongres belum sanggup mengimbangi ratusan juta kicauan yang datang setiap hari. Akibatnya, koleksi sulit diakses.
Misalnya, untuk mencari kata kunci sederhana saja butuh waktu 24 jam. Terlalu lama. Solusinya dibuat katalog yang diyaÂkini bisa memangkas waktu pencarian. Tapi untuk membuat katalog data skala sebesar dan sekompleks itu dibutuhkan waktu bulanan hingga tahunan.
Sampai sekarang Perpustakaan Kongres menerima setidaknya 400 permintaan penggunaan data kicauan dari seluruh dunia setiap hari. Minat yang tinggi ini mengindikasikan Twitter sebagai alat yang ampuh untuk menganalisis gejala sosial di masyarakat.
Salah seorang yang tertarik memakai data Twitter adalah Sherry Emergy, peneliti senior dari Institute for Health Research and Policy, University of Illinois. Ia bermaksud menganalisis pengaruh iklan terhadap kebiasaan merokok. Kata kunci yang dimasukkan adalah smoking.
Tapi, apa yang terjadi, dengan kata itu muncul 50 juta kicauan. Emergy pun bingung. Sebab, kicauan yang muncul terÂmasuk kata-kata seperti mengisap ganja (smoking weed), iga bakar (smoking ribs), atau perempuan seksi (smoking hot girls). "Satu pekerjaan besarnya buat mereka, memilah data," ujar Emergy.
Toh, meski masih banyak kekurangan, beragamnya permintaan penelitian terhadap koleksi kicauan dengan 140 karakter ini membuktikan kedigdayaan media sosial dalam sejarah manusia. "Sangat menyenangkan ketika kicauan menjadi bagian dari sejarah," ucap pengembang Twitter melalui blog resmi mereka.
Anton William (Time, CNN)
Baca berita dengan sedikit iklan, klik di sini
Baca berita dengan sedikit iklan, klik di sini
Baca berita dengan sedikit iklan, klik di sini
- Akses edisi mingguan dari Tahun 1971
- Akses penuh seluruh artikel Tempo+
- Baca dengan lebih sedikit gangguan iklan
- Fitur baca cepat di edisi Mingguan
- Anda Mendukung Independensi Jurnalisme Tempo