K-Means Clustering Untuk Mengetahui Karakteristik Film Terbaik
Tiga mahasiswa jurusan Statistika Universitas Islam Indonesia (UII) yang terdiri dari Hafizah Ilma (2015), Mega Cahaya Dewi (2014), dan Gifa Delyani N. (2016) melakukan penelitian tentang karakteristik film terbaik menggunakan K-Means Clustering.
Disampaikan Hafizah Ilma selaku ketua Tim pada Jumat (13/7) , saat ini perkembangan teknologi yang begitu pesat, khususnya internet mempengaruhi banyaknya data yang dapat diakses dengan bebas oleh setiap individu sehingga menyebabkan terjadinya fenomena Big Data. Salah satu situs website yang kerap kali digunakan adalah Internet Movie Database (IMDb).
Hafizah Ilma menuturkan, pada website tersebut telah memuat informasi tentang film di seluruh dunia, baik itu rating di IMDb, genre, durasi, jumlah voting untuk film tersebut, pendapatan yang dihasilkan, bahkan juga terdapat informasi tentang orang-orang yang terlibat di dalamnya mulai dari actor, sutradara, penulis sampai penata rias dan soundtrack.
“Berdasarkan latar belakang tersebut dengan menggunakan algoritma K-Means Clustering yang merupakan salah satu cabang ilmu dari Data Mining, peniliti dapat mengelompokkan data hasil scraping yang didapatkan di website IMDB berdasarkan durasi, rating, voting, dan pendapatan film,” ungkap Hafizah Ilma .
Sementara disampaikan GIfa Delyani, dengan metode yang digunakan didapatkan 3 cluster terbaik mengacu pada plot WCSS, dengan cluster 3 memiliki karakteristik terbaik. “Dikarenakan film-film pada cluster 3 memiliki nilai durasi, rating, voting, dan pendapatan film paling tinggi diantara 3 lainnya. Dengan jumlah film didalamnya ada 5 film yaitu : “Thor: Ragnarok, Blade Runner 2049, IT, Dunkirk, dan LOGAN,” ungkap GIfa Delyani.