Sistem pencatatan kehadiran masih menghadapi berbagai tantangan di dunia nyata, seperti risiko kesalahan dan potensi kecurangan. Identifikasi wajah bersifat non-intrusive dan mudah dideteksi, sehingga menjadi alternatif yang menjanjikan dibandingkan metode tradisional. Namun, kondisi pencahayaan dan sudut pandang yang bervariasi dapat mengurangi akurasi sistem identifikasi. Penelitian ini bertujuan untuk mengembangkan sistem pencatatan kehadiran berbasis identifikasi wajah menggunakan kamera pengawas yang bekerja secara otomatis tanpa interaksi langsung dari pengguna. Metode yang digunakan menggabungkan Vision Transformer (ViT), transfer learning, dan multi-view dataset. Model dilatih menggunakan CASIA WebFace dan VGGFace2 Train-Set, lalu dievaluasi melalui pendekatan pair matching dan gallery-query set pada LFW dan VGGFace2 Test-Set. Hasil menunjukkan bahwa penerapan transfer learning meningkatkan akurasi secara signifikan. Pelatihan pada multi-view dataset membantu model menangani keragaman sudut pandang di dunia nyata. Konfigurasi terbaik ditemukan pada kombinasi sembilan rentang sudut pandang berbeda dengan minimum lima sudut per identitas, menghasilkan skor CMC@1 sebesar 0,9479 pada LFW dan 0,7911 pada VGGFace2 Test-Set.