Text
Implementasi Transfer Learning dalam Mengklasifikasikan File Malware Berbasis Gambar pada Dataset Dumpware10
Abstrak:
Malware adalah program komputer yang diciptakan dengan tujuan untuk merusak dan mengganggu kinerja serta mencuri informasi pada suatu sistem. Teknik signature-based dan anomaly-based untuk mengatasi adanya malware, memiliki hambatan dalam prosesnya saat mengatasi jenis malware polymorphic, yaitu jenis malware yang dapat mengubah struktur datanya setiap kali dieksekusi. Terdapat sebuah pendekatan dalam melakukan klasifikasi malware polymorphic yaitu dengan memvisualisasikan binary malware menjadi sebuah file gambar. Oleh karena itu pada penelitian ini akan dilakukan klasifikasi file malware berbasis gambar menggunakan beberapa model transfer learning yaitu EfficienNetV2, InceptionV4 dan Xception pada dataset Dumpware10. Selain itu juga pada setiap model diterapkan dengan dan tanpa augmentasi data yang bertujuan untuk mengetahui perbedaan waktu pelatihan. Hasil dari penelitian ini berupa perbandingan dari segi performa terbaik yang dilihat dari nilai evaluasi yang mana menunjukan bahwa Xception tanpa penerapan augmentasi data mendapatkan akurasi tertinggi yaitu 97% dengan waktu pelatihan selama 27916 detik dan untuk model dengan penerapan augmentasi data, didapatkan juga oleh model Xception dengan hasil akurasi 96% dengan waktu pelatihan selama 27546 detik. Untuk segi perbandingan waktu pelatihan, seluruh model dengan penerapan augmentasi data terbukti memiliki waktu pelatihan yang lebih cepat dari model yang tidak menerapkan augmentasi data tetapi dari segi akurasi untuk seluruh model dengan penerapan augmentasi data terbukti lebih rendah dari seluruh model yang tidak menerapkan augmentasi data.
Abstract:
Malware is a computer program created with the purpose of damaging, disrupting the performance, and stealing information from a system. Signature-based and anomaly-based techniques to address malware encounter obstacles when dealing with polymorphic malware, a type of malware capable of altering its data structure each time it is executed. A classification approach exists for polymorphic malware, which involves visualizing binary malware as an image file. Hence, this research involves classifying malware files based on images using several transfer learning models: EfficientNetV2, InceptionV4, and Xception on the Dumpware10 dataset. Additionally, each model is applied with and without data augmentation to ascertain differences in training time. The results of this study encompass a comparison in terms of optimal performance evaluated based on metrics. The findings demonstrate that Xception without data augmentation achieves the highest accuracy, reaching 97%, with a training time of 27916 seconds. Similarly, for models with data augmentation, Xception also attains the highest accuracy of 96%, while its training time amounts to 27546 seconds. In terms of training time comparison, all models with data augmentation implementation have been proven to have a faster training time than the models that do not apply data augmentation. However, in terms of accuracy, all models with data augmentation implementation have been shown to be lower than the accuracy of all models that do not apply data augmentation.
No copy data
No other version available