”Everybody Lies”: Kata ”Big Data” tentang Dunia Kita
Data yang terkumpul dalam volume besar dan cepat dapat dianalisis sehingga memberikan informasi baru bahkan prediktif. Informasi dari big data tersebut bahkan dapat mematahkan kebohongan-kebohongan yang sengaja dibuat.
Buku ini mengajak pembaca untuk memahami, memercayai, dan memanfaatkan kekuatan big data. Dengan contoh-contoh sederhana dan dekat dengan keseharian kita, buku ini menunjukkan bahwa big data mampu mengungkap hal-hal yang tersembunyi dengan metode yang baru.
Ketika kita mendengar kata big data, apa yang terlintas dalam pikiran kita? Jutaan data, data dalam internet, atau data pribadi?
Meskipun sering kita dengar, kita sulit membayangkan bagaimana big data pada zaman ini dianggap sebagai harta yang paling berharga. Seolah-lah, big data adalah sesuatu yang jauh dari kehidupan kita. Benarkah demikian?
Mari kita masuk dalam pengalaman kita sehari-hari dalam menggunakan internet. Sebagai pengguna internet, kita semakin terbiasa untuk menanyakan segala sesuatu kepada mesin pencari, salah satunya dan yang paling besar adalah Google.
Kepada Google, kita bertanya segala sesuatu, mulai dari persoalan virus korona yang sedang menjadi pandemi, cara hidup sehat, cara menjadi orang sukses, cara naik MRT, cara membuat channel Youtube, hingga cara menurunkan kolesterol.
Kita juga terbiasa bertanya dengan kalimat pembuka ”apa itu”, seperti misalnya, apa itu bucin, apa itu ferguso, apa itu gerd, apa itu KKN, hingga apa itu unicorn.
Berbagai hal yang kita ketikkan dalam mesin pencarian tersebut akan direkam dan diproses oleh mesin tersebut sehingga menjadi sebuah kumpulan data yang dapat diklasifikasikan sesuai waktu dan tempat. Dengan menggunakan peranti seperti Google Trends, kita dapat ”memetik” data tersebut menjadi sebuah informasi yang berguna bagi kita.
Big data telah menjadi bagian dari cara hidup kita sebagai manusia yang semakin tergantung dengan internet.
Inilah big data. Partisipasi kita dalam memasukkan informasi apa pun di mesin pencarian, termasuk data diri kita dalam berbagai formulir pendaftaran, ikut menyumbang pembentukan big data.
Kebiasaan kita tersebut telah membantu para ”penambang data” dalam memotret sebuah fenomena menggunakan big data. Bahkan, ada kalanya kita sendirilah yang menciptakan big data itu dari hal-hal yang tidak kita sadari.
Oleh karena itulah, big data bukanlah sesuatu yang jauh dari kita, melainkan telah menjadi bagian dari cara hidup kita sebagai manusia yang semakin bergantung pada internet.
Seth Stephens-Davidowitz menggunakan kesimpulan tersebut untuk mengawali bukunya Everybody Lies: Big Data dan Apa yang Diungkapkan Internet tentang Siapa Kita Sesungguhnya.
Semua orang berbohong
Dengan judulnya yang sangat provokatif, Everybody Lies, buku ini memberikan rasa penasaran bagi pembacanya. Benarkah semua orang berbohong?
Stephens-Davidowitz menunjukkan kebohongan semua orang dengan sebuah pembuktian di awal bukunya.
Ia mulai dengan menunjukkan sebuah keraguannya terhadap anggapan umum masyarakat AS bahwa rasisme di AS telah berhasil ditekan. Anggapan ini berkembang bersamaan dengan fakta terpilihnya Obama sebagai presiden AS berkulit hitam pertama.
Oleh karena itu, Stephens-Davidowitz melakukan penelitian khusus menggunakan data dari situs pencarian Google untuk memotret peta rasisme di AS. Ia menyimpulkan bahwa anggapan umum tentang rasisme di AS yang berhasil ditekan adalah salah.
Kesimpulan tersebut ia teguhkan dengan penelitian dengan metode yang sama tentang keterpilihan Donald Trump sebagai presiden AS. Ia menemukan bahwa rasisme terhadap kulit hitam di AS ternyata menguntungkan Donald Trump dalam Pemilu di AS pada tahun 2016.
Oleh karena itu, sebuah kebohongan telah diungkapkan melalui penelitian dengan menggunakan big data. Menurut Stephens-Davidowitz, di hadapan mesin pencarian, para pengguna internet akan mempertanyakan segala sesuatu dengan jujur. Kejujuran tersebut belum tentu ditemukan dalam situasi lain.
Orang masih bisa berbohong ketika mengisi sebuah angket survei maupun jajak pendapat. Akan tetapi, orang akan cenderung jujur ketika mengetikkan sebuah pernyataan atau pertanyaan yang dia butuhkan di mesin pencarian.
Ada banyak kebohongan yang kita sampaikan di dunia nyata, tetapi tidak di dunia maya.
Buku ini mengajak pembaca untuk menyadari bahwa sumber data daring, yaitu data dari Google, memungkinkan orang mengakui hal-hal yang tidak akan mereka akui di tempat lain.
Kata-kata yang diketikkan dalam kotak pencarian Google adalah sesuatu yang benar-benar ingin orang cari atau ketahui. Setidaknya, sadar atau tidak sadar, pengguna Google memberikan sumber data yang sangat jujur.
Apabila ini diolah dan dianalisis, data ini memberikan informasi baru bahkan prediktif yang sangat bermanfaat. Informasi ini dapat mematahkan kebohongan orang-orang. Dari contoh tersebut, Stephens-Davidowitz ingin menegaskan bahwa big data berfungsi sebagai serum kebenaran digital.
Dari sinilah penulis mengungkap bahwa ada banyak kebohongan yang kita sampaikan di dunia nyata, tetapi tidak di dunia maya.
Dengan sederhana, Stephens-Davidowitz menunjukkan bahwa kebenaran akan kebohongan itu dapat terjawab melalui big data. Ia menyebut, big data menjadi sebuah revolusi dahsyat untuk mengungkap fakta-fakta yang sebelumnya tidak kita dapatkan dari cara pengambilan data lain.
Skeptisisme metodologis
Kegusaran Stephens-Davidowitz akan beberapa anggapan atau isu masyarakat yang tidak berdasarkan data memancing pembaca untuk ikut skeptis memandang setiap fenomena sosial yang terjadi sehari-hari.
Sebagai contoh, Stephens-Davidowitz memancing pembaca melalui anggapan umum bahwa kebanyakan pemain NBA dibesarkan dalam kemiskinan.
Faktanya, dari data yang diperolehnya, Stephens-Davidowitz menunjukkan bahwa seseorang akan memiliki peluang lebih besar untuk bergabung dengan NBA jika dilahirkan di wilayah yang makmur. Selain itu, latar belakang keluarga yang stabil lebih berpotensi membawa orang-orang masuk ke NBA. Dengan demikian, Stephens-Davidowitz mematahkan anggapan umum tentang asal-usul kebanyakan pemain NBA.
Sepanjang tulisannya, pembuktian penggunaan big data untuk mematahkan anggapan masyarakat menjadi simpul penegasan Stephens-Davidowitz atas kekuatan big data.
Menariknya, melalui penelitian berbasis data digital, Stephens-Davidowitz juga menggugat teori dan hasil penelitian lain. Sebagai contoh, Stephens-Davidowitz dengan berani menyanggah teori Sigmund Freud. Dalam hal ini, ia menguji data catatan mimpi orang-orang dari sebuah aplikasi.
Big data merupakan sebuah revolusi, terutama untuk ilmu-ilmu sosial.
Tidak hanya penelitian tentang mimpi dan politik, sang penulis juga menyajikan beragam hasil penelitian menggunakan big data, seperti pemilihan kuda terbaik, kebenaran penganiayaan anak dan aborsi, prediksi bintang Super Bowl, hingga kehidupan seks masyarakat.
Ia mengajak para pembaca bukunya untuk bersikap skeptis secara metodologis terhadap setiap kesimpulan yang selama ini telah dianggap sebagai kebenaran umum di masyarakat.
Lebih daripada itu, Stephens-Davidowitz juga menggugah pembaca untuk turut serta menjajal penggunaan big data untuk memecahkan masalah. Dan, yang lebih penting, ia menunjukkan bahwa big data sangat bermanfaat bagi kehidupan kita.
Perkataan Steven Levit, ”perpaduan dari rasa ingin tahu, kreativitas, dan data bisa secara dramatis meningkatkan pemahaman kita tentang dunia”, menjadi semangat Stephens-Davidowitz dalam menarik pembacanya untuk turut mencintai data.
Karena dapat digunakan dengan mudah untuk berbagai bidang, penulis menyebut bahwa big data merupakan sebuah revolusi, terutama untuk ilmu-ilmu sosial.
Cara memandang data
Sebelum menggunakan big data, menurut Stephens-Davidowitz, kita harus memiliki cara pandang baru terhadap data.
Pada era digital ini diperlukan cara yang sangat berbeda untuk membayangkan apa yang disebut dengan data. Data tidak lagi hanya berupa angka, tetapi dapat berupa kata-kata, gambar, hingga bagian tubuh.
Stephens-Davidowitz mengingatkan hal ini dalam ragam data yang dibahasnya dalam Bab 3. ”Dewasa ini, ilmuwan tidak boleh membatasi diri pada cara memandang data yang sempit atau tradisional. Saat ini foto-foto antrean di toko swalayan adalah data yang berharga. Rak toko swalayan yang penuh adalah data. Matangnya apel adalah data. Foto ruang angkasa adalah data. Lengkungan bibir adalah data. Semuanya data!”
Big data adalah persoalan menemukan tipe data yang lebih baik, pengumpulan data yang tepat, dan tawaran bentuk informasi baru untuk dipelajari.
Dari mengubah cara pandang terhadap data, Stephens-Davidowitz mengajak pembacanya memahami apa itu big data. Ia menegaskan bahwa big data bukan hanya dilihat dari banyaknya jumlah data yang dimiliki. Lebih daripada itu, big data adalah persoalan menemukan tipe data yang lebih baik, pengumpulan data yang tepat, dan tawaran bentuk informasi baru untuk dipelajari.
Selain itu, sejak awal penulis sudah menawarkan empat kekuatan big data yang menurut dia sangat penting.
Pertama, big data menawarkan tipe data baru. Kedua, big data menawarkan data yang jujur. Ketiga, big data memberikan kita peluang untuk melihat bagian terkecil dari data sehingga analisis menjadi spesifik. Keempat, bagi para peneliti, big data dapat digunakan untuk uji sebab akibat tidak semata-mata hanya uji korelasi.
Keempat kekuatan tersebut dirinci satu per satu dalam buku ini. Cara pemanfaatannya juga dijelaskan melalui contoh hasil riset.
Sebuah permulaan
Tanpa melebih-lebihkan big data, pada akhir bukunya, Stephens-Davidowitz mengingatkan akan keterbatasan big data. Hasil dari pengolahan big data membutuhkan uji tambahan sehingga memberikan informasi yang valid.
Meskipun membantah beberapa hasil survei, Stephens-Davidowitz menyadari bahwa data kecil dari survei dibutuhkan sebagai pelengkap dan validasi hasil pengolahan big data. Ia juga mengingatkan bahwa hasil pengolahan big data juga harus dimaknai dengan etika yang baik, bukan digunakan semena-mena.
Hasil dari pengolahan big data membutuhkan uji tambahan sehingga memberikan informasi yang valid.
Selain itu, Stephens-Davidowitz menegaskan bahwa semua penelitiannya menggunakan data Google selama hampir setiap tahun dalam empat tahun hanyalah sebuah permulaan. ”Untuk buku ini, kesimpulannya mudah. Himpunan data yang saya bahas di sini bersifat revolusioner, tapi baru mulai dieksplorasi.”
Sedikit sindiran ia tuliskan kepada beberapa bidang ilmu yang tidak tersentuh oleh revolusi digital ini. Hal tersebut disampaikan sekaligus untuk mengingatkan para akademisi untuk tidak mengabaikan ledakan data yang disebabkan oleh zaman digital.
Stephens-Davidowitz berharap, big data diakui sebagai sebuah sumber data yang valid di dalam penelitian ilmiah sosial.
Jangan tinggalkan data
Dalam delapan bab dan lima bagian, Stephens-Davidowitz berupaya untuk mengenalkan data hingga big data. Ia juga menjelaskan beragam jenis data, cara-cara pemanfaatannya, manfaat data, profesi data scientist, hingga revolusi data.
Sebagai ahli data lulusan Harvard pada 2013, Stephens-Davidowitz sangat optimistis dengan kekuatan data. Salah satu kekuatan yang melandasi penulisan buku ini adalah data menerangkan hal-hal yang menjadi kebohongan masyarakat sehari-hari yang ditangkis menggunakan data. Sang penulis membahasnya dalam beberapa tema, seperti kebohongan tentang usia, besaran pendapatan, minat pornografi, rasisme, hingga selera humor.
Bab-bab dalam buku ini akan lebih nyaman apabila dibaca dengan urut, dari awal ke akhir. Stephens-Davidowitz menuntun pembaca yang awam tentang data dengan memberikan gambaran tentang data di bagian awal bukunya.
Jangan mudah percaya terhadap hal-hal yang beredar di masyarakat. Percayalah kepada data!
Beberapa contoh penggunaan big data memang tampaknya rumit, misalnya pada Bab 7 tentang keterbatasan penggunaan big data untuk meramalkan pasar saham.
Namun, kerumitan ini mampu mendorong pembaca untuk mempraktikkan sendiri penggunaan big data. Hal ini dapat dilakukan dengan menggunakan Google Trends.
Seperti yang telah dilakukan oleh Stephens-Davidowitz dalam berbagai penelitiannya, pembaca dapat mengetahui kuantifikasi dari kata-kata yang dicari melalui situs pencarian Google sekaligus mengetahui tren untuk melihat pola pencarian kata-kata tersebut pada waktu tertentu.
Baca juga : ”Why We Sleep”: Hidup Panjang Dimulai dari Tidur Panjang
Jika pembaca sudah sampai tahap ini, setidaknya satu tujuan Stephens-Davidowitz dalam buku ini terwujud, yaitu memengaruhi orang untuk mengekspresikan kreativitas dan rasa ingin tahu dalam analisis data.
Sebuah kesimpulan di akhir menjadi poin penting dari pembahasan Stephens-Davidowitz dalam keseluruhan bukunya, yaitu bahwa data sangat berharga. Ia memberikan pesan yang sekaligus menutup bukunya,
”Kita harus mengikuti big data ke mana pun petunjuk yang dia berikan dan bertindak sesuai petunjuk itu. Jadi, saya menyimpulkan buku ini dengan satu-satunya cara yang sesuai: dengan mengikuti data, apa yang benar-benar orang lakukan, bukan apa yang mereka katakan.”
Pesan ini sekaligus menjadi pengingat bahwa jangan mudah percaya terhadap hal-hal yang beredar di masyarakat. Percayalah kepada data!
(LITBANG KOMPAS)
Baca juga : Mengapa Harus Membayar Berita Daring?