Statistika Ria dan Festival Sains Data (Satria Data) 2022 merupakan ajang untuk melakukan para talenda muda di bidang sains data. Kita berharap ajang seperti ini akan menjadikan peserta menyukai untuk bergelut dengan data dan mengembangkan kemampuan menambang makna dari data. Data tidak berbicara sendiri dan harus “disiksa” dengan beragam kakas dan model, supaya “mengakui” pesan yang dibawanya.
Seminar pembuka yang dibingkai dengan tema “Genggam Data Kuasai Dunia Menuju Era Otomatisasi” menjadi pembuka rangkaian Satria Data 2022. Tema tersebut valid dan banyak bukti yang bisa dihadirkan untuk mendukungnya. Namun demikian, beberapa catatan dapat diberikan untuk memberikan arah, terkait sikap kita terhadap data dan nilai yang membimbing analisis mahadata (big data).
Sikap terhadap data
Pertama, mari kita konseptualisasi beragam sikap terhadap data. Sikap ini akan sangat terkait dengan keputusan yang kita buat dan hubungannya dengan data.
Paling tidak ada tiga pilihan pendekatan memposisikan data dan keputusan yang kita buat. Yang pertama adalah keputusan yang terdorong-data (data-driven). Frasa ini paling populer digunakan. Pendekatan ini digunakan untuk validasi. Tetapi perlu dilihat, bahwa pendekatan ini cenderung mekanis dan berdasar data yang ada, tanpa melibatkan akal sehat (common sense).
Sebagai contoh, keputusan memberi sanksi akademik kepada mahasiswa hanya melihat data yang ada, tanpa melihat konteks lain. Seorang mahasiswa yang mempunyai indeks prestasi rendah diberi tafsir tunggal: tidak mampu secara akademik. Pendekatan terdorong-data, tidak akan melihat cerita di belakang data.
Pendekatan yang kedua mengandaikan bahwa keputusan yang kita ambil terinformasi-data (data-informed). Pendekatan ini menggunakan akal sehat dan melihat konteks. Di sini, kita pun berpikir kritis apakah data dapat ekstrapolasi.
Pendekatan ini dapat digunakan untuk mengembangkan inovasi. Keputusan pun lebih bersifat organik, dan tidak lagi mekanis hanya berdasar data yang diberikan oleh mesin. Sebagai ilustrasi, seorang mahasiswa dengan indeks prestasi rendah bukan melulu karena bodoh, tetapi bisa jadi karena beban keluarga lain, termasuk menjadi tulang punggung keluarga.
Pendekatan ketiga melangkah lebih jauh, yaitu bahwa keputusan yang kita ambil tersinspirasi-data (data-inspired). Jika dalam pendekatan terdorong-data kita berusaha memahami semua ukuran metriks, maka dalam pendekatan terinspirasi-data ini, kita berusaha mengembangkan cerita dengan angka-angka yang tersedia.
Dalam pendekatan ini, kita pun akan mencoba menggunakan data lain untuk mencari penjelas, dan menghubungkan antartitik dari beragam tilikan yang muncul.
Berdasar pemahaman ini, kasus mahasiswa dengan indeks prestasi rendah yang menjadi tulang punggung keluarga dapat menjadi inspirasi formulasi beragam program intervensi, misalnya. Di sini, kita membangun narasi atau cerita, dan bahkan hipotesis dan mengimajinasi kemungkinan-kemungkinan.
Nilai abadi sebagai bingkai
Kedua, selama ini kita cenderung lebih banyak mendengar dan membaca sisi baik mahadata, dengan segala potensinya. Namun, mahadata dan olahan turunannya bukan tanpa masalah. Ada sisi gelap yang perlu disadari dan dimitigasi (Goodwin, 2016).
Termasuk di dalamnya adalah potensi eksploitasi manusia atas manusia lain, melalui manipulasi opini dan penggiringan perilaku. Manipulasi opini dapat dilakukan dengan penyebaran informasi bohong atau hoaks, yang diamplikasi dengan algoritma tertentu. Penggiringan perilaku juga dimungkinkan dengan penambangan mahadata.
Penggunaan pasukan siber, baik berupa manusia atau akun terautomatisasi untuk melantangkan pesan di dunia maya, adalah salah satu contohnya (Bradshaw, Bailey, & Howard, 2021). Di samping itu, perusahaan-perusahaan kelas dunia yang menggumpulkan data penggunanya, juga sangat mungkin terjerat dalam praktik ini, dan bisa jadi bahkan menjadi strategi bisnisnya (The Economist, 2017). Inilah yang oleh Zuboff (2019) disebut telah menghadirkan kapitalisme pengintaian (surveillance capitalism).
Karenanya, kesadaran akan nilai-nilai abadi menjadi sangat penting untuk memitigasi sisi gelap mahadata. Nilai abadi tersebut termasuk kejujuran, keadilan, dan juga kesetaraan.
Untuk itulah, pengajaran dan implementasi semua algoritma dalam menambang mahadata harus dibarengi dengan penguatan nilai-nilai. Saintis data sudah seharusnya juga orang yang anti-eksploitasi manusia atas manusia lainnya, baik secara ekonomis maupun politik. Kode etik untuk saintis data yang dilengkapi dengan ilustrasi kaya yang meneguhkan kesadaran perlu disusun dan dilantangkan.
Akhirnya, dengan kesadaran penuh atas beragam manfaat dari mahadata, di saat yang sama, manusia dan kemanusiaan harus diselamatkan dari sisi gelap mahadata.
Referensi
Bradshaw, S., Bailey, H. & Howard, P. N. (2021) Industrialized disinformation: 2020 global inventory of organised social media manipulation. Working Paper 2021.1. Oxford, UK: Project on Computational Propaganda.
Goodwin, T. (2016). The dark side of big data. Forbes. Tersedia daring: https://www.forbes.com/sites/tomfgoodwin/2016/07/14/the-dark-side-of-big-data/
The Economist (2017). The world’s most valuable resource is no longer oil, but data. The Economist. Tersedia daring: https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data
Zuboff, S. (2019). The age of surveillance capitalism: The fight for a human future at the new frontier of power. London: Profile Books.
Sambutan pada pembukaan seminar nasional dalam rangkaian Statistika Ria dan Festival Sains Data (Satria Data) 2022 di Universitas Islam Indonesia pada 15 Oktober 2022.