Derin Öğrenme Yöntemleri ile Şüpheli Davraniş Tespiti

9ENA...CWmE
18 Jan 2024
38

İnsan davranışının ve çevresiyle etkileşiminin otomatik olarak anlaşılması, çeşitli alanlardaki potansiyel uygulamaları nedeniyle günümüzde ilgi çekici bir araştırma alanı olmuştur. Bu araştırma alanları insan davranışını çok yönlü (duygular, ilişkisel tutumlar, eylemler, yüz ifadeleri vb.) modellemeye çalışır. Gerek uluslararası, gerek ulusal veya ticari özel sektör girişimlerinde bilgi insanlık tarihi kadar köklü bir geçmişe dayanan ve insanlığın var olduğu sürece de önemini korumaya; vazgeçilmez bir güç olmaya devam edecek, çok önemli bir olgu ve bir teknolojidir. Yüz yıllardır bilgi sızıntılarının neden olduğu olgular genelde eylemler, davranışlar gerçekleştikten ve istenmeyen sonuçlarla karşılaşıldıktan sonra tespit edilebilmektedir. 21. yüzyılda teknolojinin de hayatımızın her alanına girmesi ile bu bilgi sızıntılarıda önceki dönemlere göre kıyaslandığında teknoloji ile; yani akılı cihazlar aracılığı ile gerçekleştirilmekte ve her geçen gün artış eğiliminde olduğu görünmektedir [1-2]. Yapay Zekâ, en genel ifade ile insana özgü bilişsel, öğreneme, muhakeme etme özelliklerinin yüz yıllardır makinelere aktarma çalışmaları olarak ifade edilebilecek geniş bir çalışma alanıdır. Derin öğrenme, insanın düşünce yapısını veri setlerindeki örüntüler ile deneyimleyerek bilgisayara öğreten, yapay zekâ kavramını içinde barındırdığı makine öğrenmesi konusunun birçok multidisipliner alan ile çalışılabilir özel bir halidir [3]. Yüz ifadelerimiz, hareket pozisyonumuz, nesneler suç eğilimi hakkında beklenenden daha fazlasını ifşa edebilir. Bir kişinin davranışları hakkında bilgi sahibi olabilir ve insanların yüzlerine bakarak duygularını çıkarılabilir; ve insan davranışının spesifik hali şüpheli eğilimleri hakkında önemli çıkarımlar elde edilebilir.
İnsan davranışının ve çevresiyle etkileşiminin otomatik olarak anlaşılması, çeşitli alanlardaki potansiyel uygulamaları nedeniyle günümüzde ilgi çekici bir araştırma alanı olmuştur. Bu araştırma alanları insan davranışını çok yönlü (duygular, ilişkisel tutumlar, eylemler, yüz ifadeleri vb.) modellemeye çalışır. Gerek uluslararası, gerek ulusal veya ticari özel sektör girişimlerinde bilgi insanlık tarihi kadar köklü bir geçmişe dayanan ve insanlığın var olduğu sürece de önemini korumaya; vazgeçilmez bir güç olmaya devam edecek, çok önemli bir olgu ve bir teknolojidir. Yüz yıllardır bilgi sızıntılarının neden olduğu olgular genelde eylemler, davranışlar gerçekleştikten ve istenmeyen sonuçlarla karşılaşıldıktan sonra tespit edilebilmektedir. 21. yüzyılda teknolojinin de hayatımızın her alanına girmesi ile bu bilgi sızıntılarıda önceki dönemlere göre kıyaslandığında teknoloji ile; yani akılı cihazlar aracılığı ile gerçekleştirilmekte ve her geçen gün artış eğiliminde olduğu görünmektedir [1-2]. Yapay Zekâ, en genel ifade ile insana özgü bilişsel, öğreneme, muhakeme etme özelliklerinin yüz yıllardır makinelere aktarma çalışmaları olarak ifade edilebilecek geniş bir çalışma alanıdır. Derin öğrenme, insanın düşünce yapısını veri setlerindeki örüntüler ile deneyimleyerek bilgisayara öğreten, yapay zekâ kavramını içinde barındırdığı makine öğrenmesi konusunun birçok multidisipliner alan ile çalışılabilir özel bir halidir [3]. Yüz ifadelerimiz, hareket pozisyonumuz, nesneler suç eğilimi hakkında beklenenden daha fazlasını ifşa edebilir. Bir kişinin davranışları hakkında bilgi sahibi olabilir ve insanların yüzlerine bakarak duygularını çıkarılabilir; ve insan davranışının spesifik hali şüpheli eğilimleri hakkında önemli çıkarımlar elde edilebilir.
Halgurg ve ark. 2021’ de, BT ve X-ray gibi göğüs radyografilerini kullanarak coronavirüs vakalarını tespit etmede X-ışınları ve BT tarama görüntüleri üzerine basit bir evrişim sinir ağı (CNN) ve modifiye edilmiş önceden eğitilmiş AlexNet modeli uygulanmıştır. Deneylerin sonucu, kullanılan modellerin önceden eğitilmiş ağ üzerinden %98'e kadar doğruluk ve modifiye CNN kullanılarak %94,1 doğruluk sağlayabildiğini göstermektedir[4]. Mehdi ve ark. 2020 yılında hastalık teşhisi ve rehabilitasyon süreci için, optimize edilmiş özellik çıkarma ve ardından doğrusal diskriminant analizi sınıflandırması (TLRN-LDA) modelini önermiş ResNet50 Derin öğrenme modeli ile transfer öğrenme konsepti kullanılarak geliştirilmiştir. 31 sınıfın zorlu standart karşılaştırmalı ImageCLEF2012 veri kümesi üzerinde kapsamlı deneyler gerçekleştirmişlerdir. Geliştirilen yaklaşım, aynı veri kümesindeki en son teknoloji yaklaşımlarla karşılaştırıldığında %10'a kadar daha yüksek olan %87,91'lik gelişmiş ortalama sınıflandırma doğruluğu sağlar[5].

Yapay Sinir Ağları

1943 yılında ilk yapay sinir ağı modeli nörolog Warren McCulloch ve matematikçi Walter Pitts tarafından tanımlanmıştır. Biyolojik bir nöron hücresi; dentrit, hücre gövdesi, aksonlar ve sinapslardan oluşmaktadır diye tanımlanmıştır [21]. Biyoloji hücresinden esinlendiğini belirttiğimiz sinir ağımız, 1957’de Rosenblatt yapay sinir ağlarının temel yapı taşı olan algılayıcı (perceptron) tanımını yapmıştır [22]. Şekil 1’de gösterilen McCulloch-Pitts modeline dayanan nöron m tane giriş parametresi(xj) almaktadır ve alınan her giriş parametresi için bir yönlendirilmiş ağırlık parametresine(wj) bağlanır. Sistemde giriş ve ağırlıklar doğrusal bir şekilde toplanır ve aktivasyon fonksiyonuna (φ) gönderilir. Aktivasyon fonksiyonunun çıkışı nöronun çıkışını(yk) üretir.. Bu işlem Denklem 1’ deki gibi formülize edilebilir [21]. İstenen çıktının üretilebilmesi için sistemin ağırlıkları dikkatle seçilerek nöronun eğitimi gerçekleştirilir. Birden fazla nöronun kullanılmasıyla oluşturulan sitemlere yapay sinir ağı denilmektedir [23]. Tez çalışmasında kullanılan yapay sinir sisteminde bu yapılar; işlemci elemanları, toplama fonksiyonları, transfer fonksiyonları, yapay nöron çıkışları ve ağırlıkları ifade etmektedir.2.1.2 Derin Öğrenme Derin öğrenme, yapay sinir ağları algoritmalarını kullanarak çok katmanlı mimarilerde çok boyutlu veriler ile çalışma imkânı sağlayan, makine öğrenmesi alanının bir alt dalıdır. Derin öğrenme; yüz tanıma, plaka tanıma, nesne algılama, hareket algılama, şerit tespiti, yaya algılama, otomatik park etme ve gelişmiş araç sürüş yardımcısı, pozisyon tanımlama, duygu algılama, doğal dil işleme, ilaç keşfi gibi birçok karmaşık problemleri çözmek için kullanılmıştır ve bu çalışmalarda ciddi bir başarım oranı elde edilmiştir. Resim tanıma ve görüntü işleme için özellikle uygun bir alandır [3]. Şekil 1’ deki biyolojik bir sinir hücresi referans alınarak Şekil 3 teki basit bir yapay sinir ağı modeli gösterilmiş ve bu yapay sinir ağının matematiksel modelinde Şekil 2’ de gösterilmiştir.Bu çalışmada gerçek zamanlı bir nesne tespit aracı olan YOLO Kriminal/şüpheli davranış görüntülerinde şüpheli davranış tespiti amacıyla kullanılmıştır ve başarılı sonuçlar elde edilmiştir. YOLO ile yapılan çalışmalar çoğunlukla günlük hayatta gözle görülebilen nesnelerin makineye öğretilip tespit etmesi amacıyla kullanılmaktadır. Bu alandaki yeni veri seti olan Marmara Üniversitesi Kriminal Davranış/Nesne (MÜKDN) veri seti üzerinde yapılan bu çalışma sayesinde YOLO’ nun davranış tespitinde kullanılabilirliği desteklenmiştir. Bir nesne tespit aracı olan YOLO ile şüpheli davranış tespitinde %70’in üzerinde başarı elde edilmiştir. Derin öğrenmede başarıyı etkileyen en önemli faktörlerden biri elde edilmesi oldukça maliyetli olan eğitim verisinin çok olmasıdır. Bu çalışmada veri seti %70 eğitim - %30 test şeklinde ayarlanarak eğitim gerçekleştirildiğinde, mAP değeri 0,5’ın altında çıkmıştır. %86,66’in üzerindeki başarıya ulaşılmıştır. Daha büyük bir veri seti ile başarının daha da yüksek çıkması beklenmektedir. GPU gücünün makine öğrenmesi için fazlasıyla yeterli olduğu günümüzde en önemli ihtiyaç veridir. Makine ne kadar çok veri ile eğitilirse, insan davranışının makinelerce taklit edilebilmesi o kadar iyi sağlanabilir. Günümüzde teknoloji kullanımının (sosyal medya vb.) artması sayesinde çok fazla veri birikmektedir. Etik kurallarına da uyarak, kişisel veri olmayacak verilerden veya kişisel verileri barındırmayacak şekilde toplanacak verilerle veri setleri oluşturulması ve bu verilerin gelecekte yapılacak bilimsel çalışmalara da fayda sağlaması için paylaşılması önemlidir. Bu çalışmada kullanılan Marmara Üniversitesi Kriminal Davranış/Nesne (MÜKDN) veri seti oluşturulmuş olup, YOLO formatında etiket yapısı kazandırılmıştır, bu veriler paylaşılacaktır. Bu çalışmada kullanılan *.cfg dosyasındaki değerler optimum değerler değildir. Ancak mevcut hali ile şüpheli davranış tespiti yapılabilmiştir. *.cfg dosyasında yapılabilecek başka ayarlar ve YOLO katman sayısının artırılması gibi değişiklikler ile YOLO’nun başarısını artırabilir. YOLO tek sınıf ile eğitilmiş olup, sınıf sayısının eğitimdeki başarıya etki ettiği ve tek sınıflı eğitimde yüksek başarıya daha hızlı ulaşıldığı görülmüştür. Bu çalışmada sadece izinsiz görüntü alma şüpheli davranışı tespiti yapılmıştır. YOLO ile başka davranış türleri (hırsızlık, şiddet vb.) üzerinde de çalışılabilir ve farklı başarı oranlarına ulaşılabilir.

REFERANSLAR

[1] Radu, R. G. (2012). The monopoly of violence in the cyber space: Challenges of cyber security. In Power in the 21st Century (pp. 137-150). Springer, Berlin, Heidelberg.
[2] Bıçakcı, S. (2014). NATO’nun gelişen tehdit algısı: 21. yüzyılda siber güvenlik. Uluslararası İlişkiler Dergisi, 10(40), 100-130.
[3] Lecun, Y., Bottou, L., Bengio, Y., & Haffner, P. (1998). Gradient-based learning applied to document recognition.
[4] Maghdid, H., Asaad, A. T., Ghafoor, K. Z. G., Sadiq, A. S., Mirjalili, S., & Khan, M. K. K. Diagnosing COVID-19 pneumonia from x-ray and CT images using deep learning and transfer learning algorithms, 26. https://doi.org/10.1117/12.2588672[5] Hassan, M., Ali, S., Alquhayz, H., & Safdar, K. (2020). Developing intelligent medical image modality classification system using deep transfer learning and LDA. Scientific Reports, 10(1), 12868. https://doi.org/10.1038/s41598-020- 69813-
[6] Jaouedi, N., Boujnah, N., & Bouhlel, M. S. (2020). A new hybrid deep learning model for human action recognition. Journal of King Saud University - Computer and Information Sciences, 32(4), 447–453. https://doi.org/10.1016/j.jksuci.2019.09.00 4
[7] T.S., A., & Guddeti, R. M. R. (2020). Affective database for e-learning and classroom environments using Indian students’ faces, hand gestures and body postures. Future Generation Computer Systems, 108, 334–348. https://doi.org/10.1016/j.future.2020.02.07 5 [8] Jammalamadaka, N., Zisserman, A., & C.V., J. (2017). Human pose search using deep networks. Image and Vision Computing, 59, 31–43. https://doi.org/10.1016/j.imavis.2016.12.0 02
[9] Luvizon, D. C., Tabia, H., & Picard, D. (2019). Human pose regression by combining indirect part detection and contextual information. Computers & Graphics, 85, 15–22. https://doi.org/10.1016/j.cag.2019.09.002

Write & Read to Earn with BULB

Learn More

Enjoy this blog? Subscribe to peredhel

3 Comments

B
No comments yet.
Most relevant comments are displayed, so some may have been filtered out.