Kulturomik, Menebak Perilaku Kita melalui Kata-kata
Oleh
Andreas Maryoto
·4 menit baca
Kata adalah data. Lama sekali data dipersepsikan dengan angka, padahal cakupan data sangatlah luas. Bila seseorang diminta mengumpulkan data, seolah dia diminta mengumpulkan angka-angka. Kini, cakupan data makin berkembang karena keberadaan teknologi digital. Pengambilan data makin murah dan mudah. Kata-kata kita ternyata menjadi data berharga yang bisa mengungkap perilaku kita dan kebudayaan secara umum.
Di era digital, data berkembang mulai dari kata, lokasi, foto, video, dan lain-lain yang telah terdigitalkan. Sejak ditemukan mesin cetak pada pertengahan abad kelima belas, sebanyak 130 juta buku unik diterbitkan. Akan tetapi, teks-teks di dalam buku tersebut belum bisa memberikan informasi yang menyeluruh tentang kecenderungan perilaku, peristiwa, dan kebudayaan manusia secara umum.
Tahun 2004 ketika Google ingin memindai seluruh buku di sejumlah perpustakaan di dunia, orang belum mengetahui secara persis maksud dan tujuan mereka. Tentu banyak perpustakaan menolak langkah itu karena terkait dengan hak cipta dan lain-lain.
Akan tetapi, Google tetap berjalan dengan rencananya dan mereka telah memiliki mesin yang bisa membaca halaman demi halaman. Tak mengherankan jika masuk ke mesin pencari Google, kita menemukan berbagai buku dalam versi digital.
Tahun 2010 publik makin memahami rencana Google itu ketika sebuah artikel dengan judul ”Quantitative Analysis of Culture Using Millions of Digitized Books” muncul di jurnal Science. Dari sinilah kemudian muncul kajian tentang kebiasaan perilaku manusia dan kebudayaan berdasarkan teks-teks yang telah didigitalkan.
Peneliti itu memunculkan istilah untuk disiplin ilmu baru, yaitu kulturomik (culturomics) yang secara lebih lengkap diartikan sebagai kajian bahasa terkomputasi yang digunakan untuk mempelajari perilaku manusia dan kebudayaan melalui analisis kuantitatif dari teks yang telah terdigitalkan.
Hingga tahun 2012, Google berhasil memindai sekitar 15 persen dari buku-buku unik yang telah terbit sejak ditemukan mesin cetak. Analisis tentang buku atau teks yang terdigitalkan dan perilaku serta kebudayaan makin berkembang. Pada buku Big Data, The Essential Guide to Work, Life, and Learning in The Age of Insight, disebutkan pada masa-masa gelap seperti saat Nazi berkuasa, tekanan dan sensor terhadap penulis ternyata dapat diketahui dari analisis algoritma dari isi buku yang beredar.
Kata-kata di dalam buku ternyata seperti fosil yang bisa diungkap latar belakang dan konteks secara lebih luas. Oleh karena itu, seorang ahli kulturomik bekerja untuk menambang kata-kata dan mengungkapkan informasi di balik kata-kata itu seperti seorang arkeolog. Mereka bisa mengungkap berbagai hal melalui kata-kata tentang diri kita dan latar belakang kita.
Kalev H Leetaru berhasil melakukan prediksi tentang Musim Semi Arab tahun 2011 dan juga lokasi akhir Osama bin Laden hingga radius 200 kilometer. Ia meneliti nada atau kecenderungan berita-berita dari berbagai berita dan membandingkannya dengan kejadian yang mirip pada masa lalu.
Peneliti Kalev H Leetaru dalam salah satu artikel berjudul ”Culturomics 2:0 Forecasting Large-Scale Human Behavior Using Global News Media Tone in Time and Space” di jurnal First Monday pernah melakukan analisis berita-berita di media dan memadukan dengan data geografis. Ia berhasil melakukan prediksi tentang Musim Semi Arab tahun 2011 dan juga lokasi akhir Osama bin Laden hingga radius 200 kilometer. Ia meneliti nada atau kecenderungan berita-berita dari berbagai berita dan membandingkannya dengan kejadian yang mirip pada masa lalu.
Kini, di era media sosial, sumber untuk kajian kulturomik makin mudah. Setiap hari orang mengunggah berbagai kata dan kalimat di media sosial. Twitter memiliki 335 juta pengguna aktif per bulan. Facebook memiliki 2,23 miliar pengguna aktif per bulan. Dari angka ini, kita bisa membayangkan jumlah unggahan per hari atau per bulan. Dengan sumber data yang besar itu, kita bisa melakukan analisis kulturomik.
Di dalam negeri, peneliti bisa menggunakan unggahan-unggahan di media sosial untuk mengetahui kecenderungan semisal intoleransi, radikalisme, dan masalah-masalah aktual. Kata atau kalimat tertentu yang sering digunakan bisa digunakan untuk memandu peneliti dalam memastikan keakuratan antara unggahan itu dan masalah yang sedang diteliti.
Kulturomik bakal makin berkembang di tengah kemudahan mendapatkan data meski metode ini juga dikritik karena bisa memunculkan bias tertentu, misalnya ketika memilih kata atau kalimat tertentu yang berdasarkan pandangan atau suasana batin orang tertentu dengan latar belakang suku atau pengalaman yang tertentu pula.
Perilaku dan gaya hidup kita bisa dideteksi melalui berbagai unggahan di media sosial atau unggahan lain yang telah terdigitalkan. Otoritas bisa menggunakan metode ini untuk mendeteksi berbagai masalah yang berada di masyarakat hingga bisa melakukan antisipasi atau penanganan ketika masalah itu belum muncul ke permukaan.