Text
Implementasi algoritme k-means clustering untuk analisis log pada web server
Kejahatan siber di Indonesia mengalami peningkatan setiap tahunnya dengan total 1.637.973.022 serangan siber yang tercatat Badan Siber dan Sandi Negara pada tahun 2021. Serangan yang terjadi banyak terjadi melalui jaringan website perusahaan, organisasi atau pemerintahan, sehingga diperlukan upaya melakukan analisis log pada web server untuk mengetahui apa yang terjadi pada website yang dimiliki. Para administrator jaringan melakukan analisis log saat terjadi insiden, dengan menggunakan Intrusion Detection System (IDS) atau melalui log web server. Pemanfaatan tools analisis log seperti Elasticsearch, Logstash, and Kibana Stack (ELK Stack) tidak membantu dalam menemukan informasi apa yang terjadi dari log web server. Dengan menggunakan algoritme dari machine learning yaitu algoritme k-means clustering dapat dilakukan upaya untuk mencari tahu informasi yang didapatkan dari data log web server. Proses feature extraction dilakukan untuk mengubah data log web server yang berbentuk teks menjadi numerik sehingga dapat diolah oleh algoritme clustering k-means. Penentuan jumlah cluster pada proses clustering k-means melalui pendekatan elbow method. Hasilnya, dari dataset log web server yang digunakan, ditemukan bahwa terdapat sebuah informasi terjadi sebuah serangan dengan karakteristik Distributed Denial of Service (DDoS). Hasil model clustering yang mampu memilah aktifitas normal dan DDoS diselidiki lebih lanjut sengan pendekatan feature importance analysis. Dimana bertujuan untuk mengetahui feature apa saja yang berandi besar dalam proses model clustering. --
Cyber attacks in Indonesia are increasing every year with a total of 1,637,973,022 cyberattacks recorded by the National Cyber and Crypto Agency (Badan Siber dan Sandi Negara) in 2021. Many attacks occur through websites, organizations or government networks, so efforts are needed to carry out log analysis on web server to find out what happened to the website. Network administrators perform log analysis of incidents, using the Intrusion Detection System (IDS) or via web server logs. Utilization of log analysis tools such as Elasticsearch, Logstash, and Kibana Stack (ELK Stack) is not helpful in finding what information is happening from web server logs. By using algorithm from machine learning, namely algorithm k-means clustering, efforts can be made to find out information obtained from web server log data. The feature extraction process is carried out to change the web server log data in the form of numeric so that it can be processed by the k-means clustering algorithm. The next step is to determine the number of clusters from the data processed by the researcher using the elbow method. The results of the elbow method are obtained and the results show that there is a cluster away from the others. After being analyzed manually, it was found that there was information that an attack had occurred in the form of a Distributed Denial of Service (DDoS). After the information is obtained, a feature interest analysis process is carried out to find out what features affect the previous clustering process.
No other version available