Implementasi Arsitektur MTCNN pada Kelas Dimensi Piksel Berbeda dan Plotting Multi-Wajah pada Hasil Deteksi
Isi Artikel Utama
Abstrak
Deteksi wajah merupakan tugas computer vision untuk mengidentifikasi dan memverifikasi seseorang berdasarkan foto wajah mereka. Deteksi dan penyelarasan wajah di lingkungan yang tidak dibatasi sangat menantang karena berbagai pose, iluminasi, dan oklusi. Wajah manusia sulit untuk dimodelkan karena ada banyak variabel yang dapat berubah, misalnya ekspresi wajah, orientasi, kondisi pencahayaan, dan oklusi parsial, seperti kacamata hitam, syal, topeng, dan lainnya.. Studi terbaru menunjukkan bahwa pendekatan deep learning (pembelajaran yang mendalam) dapat mencapai kinerja yang mengesankan pada dua tugas ini. Pada penelitian ini akan dilakukan pendeteksian wajah pada multi-wajah sekaligus memetakan satu persatu hasil deteksi wajah yang didapat (face crop) untuk kebutuhan berbagai sistem yang berkaitan dengan pendeteksian wajah dengan menggunakan pendekatan Multi-Task Cascaded Convolutional Neural Network (MTCNN). Penelitian ini bertujuan untuk mengimplementasikan arsitektur MTCNN menggunakan TensorFlow dan OpenCV, dengan dua manfaat utama. Pertama, penelitian ini diharapkan dapat menyediakan model pra-pelatihan yang berkinerja optimal serta memperkuat bukti dari penelitian-penelitian sebelumnya yang telah meneliti model ini. Kedua, model ini dapat digunakan sebagai input bagi sistem lain. Variabel input berupa gambar foto wajah yang berisi satu atau lebih untuk diproses. Gambar foto wajah ini akan memiliki berbagai dimensi piksel untuk mewakili resolusi yang berbeda. Variabel output yang dihasilkan berupa koordinat lokasi wajah terdeteksi ataupun berupa landmark titik-titik kunci wajah, seperti posisi mata, sudut hidung, dan mulut. Hasil penelitian menunjukkan skor rata-rata pada berbagai dimensi piksel dalam dataset, dengan akurasi sebesar 93%, presisi 95%, recall 96%, F1-score 95%, dan ROC-AUC 90,89%.
Rincian Artikel

Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Kebijakan yang diajukan untuk jurnal yang menawarkan akses terbuka
Syarat yang harus dipenuhi oleh Penulis sebagai berikut:- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Commons Attribution License yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).
Referensi
Chen, X., Luo, X., Liu, X., & Fang, J. (2019). Eyes Localization Algorithm Based on Prior MTCNN Face Detection. Itaic, 1763–1767.
Du, J. (2020). High-Precision Portrait Classification Based on MTCNN and Its Application on Similarity Judgement. Journal of Physics: Conference Series, 1518(1). https://doi.org/10.1088/1742-6596/1518/1/012066
Ranjan, R., Patel, V. M., & Chellappa, R. (2019). HyperFace: A Deep Multi-Task Learning Framework for Face Detection, Landmark Localization, Pose Estimation, and Gender Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 41(1), 121–135. https://doi.org/10.1109/TPAMI.2017.2781233
Ravidas, S., & Ansari, M. A. (2018). Multi View Face Detection using Deep Learning. Ii.
Thohari, A., & Hertantyo, G. B. (2018). Implementasi Convolutional Neural Network untuk Klasifikasi Pembalap MotoGP Berbasis GPU. Proceedings on Conference on Electrical Engineering, Telematics, Industrial Technology, and Creative Media, 50–55.
Viola, P., & Jones, M. (2001). Managing work role performance: Challenges for twenty-first century organizations and their employees. Rapid Object Detection Using a Boosted Cascade of Simple Features, 511–518.
Xiang, J., & Zhu, G. (2017). Joint Face detection and Facial Expression Recognition with MTCNN. 424–427. https://doi.org/10.1109/ICISCE.2017.95
Zhang, K., Zhang, Z., Li, Z., Member, S., Qiao, Y., & Member, S. (n.d.). Joint Face Detection and Alignment using Multi - task Cascaded Convolutional Networks. 1, 1–5.
Zhao, F., Li, J., Zhang, L., Li, Z., & Na, S. G. (2020). Multi-view face recognition using deep neural networks. Future Generation Computer Systems, 111, 375–380. https://doi.org/10.1016/j.future.2020.05.002