Go-jek menyebutkan, melalui aplikasinya untuk pengiriman makanan yaitu Go-food, diketahui martabak adalah makanan yang tergolong banyak dipesan. Data tahun 2016 menyebutkan martabak yang dikirim ke pelanggan hingga 3 juta loyang. Jumlah yang tidaklah kecil. Apa yang bisa dipelajari dari data itu untuk kepentingan yang lebih besar? Apa pula yang bisa diketahui di balik seperti data martabak itu?
Pada masa lalu, peneliti membuat kerangka riset, mengumpulkan data, dan membuat kesimpulan untuk mengetahui sebuah fenomena. Kini, data itu melimpah dan berserakan. Informasi penting tersembunyi di dalam data itu. Untuk mendapatkan informasi yang bermanfaat di balik jutaan data, maka harus dilakukan analisis yang memadai. Di samping itu, korelasi antara data itu dengan fenomena lain perlu dicari.
Buku Big Data, The Essential Guide to Work, Life, and Learning in The Age of Insight memandu kita untuk memahami fenomena data yang melimpah, mengungkap informasi di balik data itu, kemudian mendapatkan informasi yang berguna hingga menjadi peluang bisnis. Analisis prediktif adalah salah satu cara analisis awal untuk mengungkap informasi penting dibalik data itu sebelum dilakukan riset lanjutan.
Sebagai contoh, pada masa lalu untuk mengetahui penyebaran penyakit flu burung peneliti akan meriset wilayah-wilayah yang diduga terserang penyakit itu kemudian mengambil sampel yang sesuai kaidah riset, baru kemudian dibuat kesimpulan. Google tidak melakukan dengan cara itu. Mereka membuat prediksi bahwa pencarian istilah terkait dengan flu burung di mesin pencari akan terkait dengan area yang terserang flu burung.
Orang yang cemas akan mencari informasi tentang flu burung di Google dan itu diasumsikan menggambarkan area terdampak. Perusahaan teknologi itu melihat istilah-istilah dalam sistem pencarian mereka yang terkait dengan flu burung hingga ditemukan bahwa di area yang terkena serangan flu burung ternyata banyak orang yang mencari informasi flu burung melalui mesin pencari Google.
Setelah dipertemukan peta serangan flu burung dari lembaga resmi ternyata sama dengan peta berbasis pencarian dari Google. Untuk memprediksi area terserang flu burung ternyata bisa dilakukan dengan penemuan data di mesin pencari, tanpa melakukan penelitian langsung di lapangan.
Sebuah penelitian dengan judul Psychological Language on Twitter Predicts County-Level Heart Disease Mortality mengungkap kaitan berbagai cuitan di Twitter dengan angka kematian akibat penyakit jantung. Mereka menjaring kata-kata kotor dan kemarahan di media sosial itu kemudian melakukan analisa prediktif. Hasilnya adalah sebuah peta prediksi kematian akibat penyakit jantung berdasarkan cuitan di Twitter di suatu wilayah di Amerika Serikat yang ternyata sama dengan peta kematian akibat penyakit jantung yang dikeluarkan Center for Disease Control and Prevention. Dengan data di media sosial kita bisa membuat prediksi mengenai angka kematian akibat penyakit jantung di suatu wilayah.
Amazon membuat kaget banyak kalangan ketika mereka berkongsi dengan dua perusahaan investasi besar yaitu JP Morgan dan Berkshire Hathaway Inc. Ketiganya akan segera memasuki bisnis kesehatan. Pilihan memasuki bisnis ini pastilah bukan sekadar spekulasi atau hanya berdasarkan data yang ada permukaan saja. Sangat boleh jadi mereka memiliki data yang semula tersembunyi di balik data penjualan dan pencarian buku kesehatan, buku penyakit tertentu, dan buku layanan kesehatan sehingga mereka memiliki informasi berharga setelah dilakukan analisa prediktif.
Kembali ke soal data martabak tadi. Apa yang ada di balik data ini? Bila pemahaman kita terhadap data ini hanya sekedar terkait dengan penjualan martabak saja maka sangatlah percuma dan selesai sampai di sini. Kita perlu melakukan analisa prediksi di balik data ini seperti tentang prediksi kondisi ekonomi sebuah wilayah, prediksi kondisi kesehatan warga, prediksi gaya hidup, prediksi tentang kondisi sosial warga, dan lain-lain.
Untuk memastikan prediksi itu, kita membutuhkan satu langkah lagi, yaitu mencari data riil tentang ekonomi, kesehatan, gaya hidup, sosial dan lain-lain untuk melihat korelasinya dengan analisis prediktif penjualan martabak. Data penjualan martabak itu sendiri pasti harus dirinci agar bisa memberikan informasi yang lebih gamblang seperti lokasi pembeli, waktu pembelian, dan lain-lain.
Lebih dari itu, setelah mendapat analisis prediktif maka bisnis apa yang bisa dibangun atau langkah apa yang bisa dilakukan otoritas setelah mendapatkan informasi yang mencukupi itu?