Implementasi Arsitektur MTCNN pada Kelas Dimensi Piksel Berbeda dan Plotting Multi-Wajah pada Hasil Deteksi

Isi Artikel Utama

Merry Anggraeni
Hillman Akhyar Damanik

Abstrak

Deteksi wajah merupakan tugas computer vision untuk mengidentifikasi dan memverifikasi seseorang berdasarkan foto wajah mereka. Deteksi dan penyelarasan wajah di lingkungan yang tidak dibatasi sangat menantang karena berbagai pose, iluminasi, dan oklusi. Wajah manusia sulit untuk dimodelkan karena ada banyak variabel yang dapat berubah, misalnya ekspresi wajah, orientasi, kondisi pencahayaan, dan oklusi parsial, seperti kacamata hitam, syal, topeng, dan lainnya.. Studi terbaru menunjukkan bahwa pendekatan deep learning (pembelajaran yang mendalam) dapat mencapai kinerja yang mengesankan pada dua tugas ini. Pada penelitian ini akan dilakukan pendeteksian wajah pada multi-wajah sekaligus memetakan satu persatu hasil deteksi wajah yang didapat (face crop) untuk kebutuhan berbagai sistem yang berkaitan dengan pendeteksian wajah dengan menggunakan pendekatan Multi-Task Cascaded Convolutional Neural Network  (MTCNN). Penelitian ini bertujuan untuk mengimplementasikan arsitektur MTCNN menggunakan TensorFlow dan OpenCV, dengan dua manfaat utama. Pertama, penelitian ini diharapkan dapat menyediakan model pra-pelatihan yang berkinerja optimal serta memperkuat bukti dari penelitian-penelitian sebelumnya yang telah meneliti model ini. Kedua, model ini dapat digunakan sebagai input bagi sistem lain. Variabel input berupa gambar foto wajah yang berisi satu atau lebih untuk diproses. Gambar foto wajah ini akan memiliki berbagai dimensi piksel untuk mewakili resolusi yang berbeda. Variabel output yang dihasilkan berupa koordinat lokasi wajah terdeteksi ataupun berupa landmark titik-titik kunci wajah, seperti posisi mata, sudut hidung, dan mulut. Hasil penelitian menunjukkan skor rata-rata pada berbagai dimensi piksel dalam dataset, dengan akurasi sebesar 93%, presisi 95%, recall 96%, F1-score 95%, dan ROC-AUC 90,89%.


 


 

Rincian Artikel

Bagian
Informatika

Referensi

Chen, X., Luo, X., Liu, X., & Fang, J. (2019). Eyes Localization Algorithm Based on Prior MTCNN Face Detection. Itaic, 1763–1767.

Du, J. (2020). High-Precision Portrait Classification Based on MTCNN and Its Application on Similarity Judgement. Journal of Physics: Conference Series, 1518(1). https://doi.org/10.1088/1742-6596/1518/1/012066

Ranjan, R., Patel, V. M., & Chellappa, R. (2019). HyperFace: A Deep Multi-Task Learning Framework for Face Detection, Landmark Localization, Pose Estimation, and Gender Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 41(1), 121–135. https://doi.org/10.1109/TPAMI.2017.2781233

Ravidas, S., & Ansari, M. A. (2018). Multi View Face Detection using Deep Learning. Ii.

Thohari, A., & Hertantyo, G. B. (2018). Implementasi Convolutional Neural Network untuk Klasifikasi Pembalap MotoGP Berbasis GPU. Proceedings on Conference on Electrical Engineering, Telematics, Industrial Technology, and Creative Media, 50–55.

Viola, P., & Jones, M. (2001). Managing work role performance: Challenges for twenty-first century organizations and their employees. Rapid Object Detection Using a Boosted Cascade of Simple Features, 511–518.

Xiang, J., & Zhu, G. (2017). Joint Face detection and Facial Expression Recognition with MTCNN. 424–427. https://doi.org/10.1109/ICISCE.2017.95

Zhang, K., Zhang, Z., Li, Z., Member, S., Qiao, Y., & Member, S. (n.d.). Joint Face Detection and Alignment using Multi - task Cascaded Convolutional Networks. 1, 1–5.

Zhao, F., Li, J., Zhang, L., Li, Z., & Na, S. G. (2020). Multi-view face recognition using deep neural networks. Future Generation Computer Systems, 111, 375–380. https://doi.org/10.1016/j.future.2020.05.002