Projekt APAKT – sztuczna inteligencja jako wsparcie w usuwaniu nielegalnych treści z sieci

Szybszemu i dokładniejszemu analizowaniu materiałów przedstawiających seksualne wykorzystanie dzieci służy projekt badawczy APAKT, którego liderem jest Państwowy Instytut Badawczy NASK. Wykorzystujący m.in. sztuczną inteligencję system odciąży w przyszłości analityków, którzy pracują na co dzień z tego typu niełatwymi treściami.

Projekt „System reagujący na zagrożenia bezpieczeństwa dzieci w cyberprzestrzeni ze szczególnym uwzględnieniem pornografii dziecięcej (APAKT)” prowadzony jest w ramach konsorcjum, w skład którego oprócz NASK wchodzi Politechnika Warszawska  oraz firma Enamor International Sp. z o.o. Finansowanie pochodzi z Narodowego Centrum Badań i Rozwoju.

 

Projektowi poświęcony jest też jeden z odcinków podcastu NASK Internetowe Rozmowy:

O tropieniu nielegalnych obrazów.

 

Zespół Dyżurnet.pl reaguje na nielegalne treści już od ponad 15. lat

Zespół Dyżurnet.pl zajmuje się reagowaniem na nielegalne, szkodliwe treści w Internecie już od ponad 15. lat. Największą troską specjalistów są materiały przedstawiające seksualne wykorzystanie dzieci (z ang. Child Sexual Abuse Material - CSAM).

 - Jeśli do zespołu trafia zgłoszenie – kierowane od użytkownika internetu, innej instytucji, innego zespołu reagowania – to pracownik Dyżurnet.pl poddaje je analizie. Sprawdza je pod kątem technicznym, np. gdzie znajduje się dana treść, ale też klasyfikuje je pod względem legalności – w jakim wieku jest ofiara, jaki jest stopień wykorzystania seksualnego. To jest bardzo trudna praca, wyczerpująca, bo oglądanie wciąż materiałów przemocowych, może wpływać na psychikę, obniżenie samopoczucia – wyjaśnia Martyna Różycka kierownik Zespołu Dyżurnet.pl.

Sztuczna inteligencja – pomoc w codziennej pracy specjalistów z Dyżurnet.pl

Zdając sobie sprawę z tego, jak potrzebne jest opracowanie systemu, który powiąże kwestie bezpieczeństwa dzieci w internecie i ochrony użytkowników przed szkodliwymi treściami z wykorzystaniem zaawansowanych narzędzi informatycznych w postaci uczących się programów, specjaliści z zespołu stworzyli Konsorcjum.

- Pomyśleliśmy, że sztuczna inteligencja AI może nas wspierać w codziennej pracy. Jeśli mówimy o treściach internetowych, niesamowicie ważna jest szybkość reakcji i podjęcie odpowiednich kroków.  Tutaj bardzo może pomóc automatyzacja, z jednej strony zdejmując z analityka konieczność klasyfikacji każdego materiału, który do nas trafia, rozpoznanie znanego już materiału a z drugiej strony naprowadzając na podjęcie odpowiednich działań – kontakt z policją czy kontakt z administratorem danego serwisu – tłumaczy Martyna Różycka.

Co będzie potrafił system APAKT

Jakie mają być zalety takiego systemu? Najistotniejsze jest to, że będzie można dzięki niemu zdjąć część powtarzalnej pracy z ludzkiego eksperta, bo przeglądanie treści CSAM nie pozostaje bez wpływu na ludzką psychikę. Co więcej, algorytmy mogą analizować treści szybciej niż człowiek. Naukowcy dopuszczają również wykorzystanie algorytmów półautomatycznych, w których na jakimś etapie pracy zaangażowany jest człowiek.

- Zaletą algorytmów jest ich powtarzalność. Pewne decyzje są w stanie podjąć w określony sposób. Ludzie podejmują decyzje w bardziej subiektywny i zmienny sposób. Jest to oczywiście wyzwanie projektowe – jak przetłumaczyć na język algorytmów pewne reguły oceny zdjęć, które czasem bywają bardzo płynne. Jaki poziom seksualnego zachowania jest dopuszczalny, od którego momentu powinien zostać zaklasyfikowany jako treść nielegalna? Nie wszystko jest łatwe do zdefiniowania – mówi zaangażowana w prace Weronika Gutfeter z Zespołu Biometrii i Inteligencji Maszynowej w NASK.

Takie algorytmy trzeba dobrze „wytrenować”, żeby właściwie działały i np. wykrywały ludzką sylwetkę czy trafnie oceniały wiek. Oznacza to, że należy zaprezentować im dużą ilość dobrej jakości danych. Wtedy sieć neuronowa będzie w stanie „nauczyć” się rozpoznawać pewne cechy charakterystyczne.

Zespół Dyżurnet.pl pracował do tej pory bez gromadzenia treści, dlatego na potrzeby projektu dane muszą zostać zebrane i właściwie zaklasyfikowane. - Ważna jest jakość umiejętności opisu tych danych, Zespół Naukowy nie widzi tego, na czym pracuje, gdyż są to treści szkodliwe i nie jest na to przygotowany. Na nas spoczywa odpowiedzialność właściwego opisania tych materiałów - podkreśla unikatowość projektu Martyna Różycka. Jest to o tyle istotne, że w przyszłości system może zostać udostępniony innym zespołom reagującym.

W założeniach projektu jest również analiza danych tekstowych. Dane do tej części też będą sukcesywnie zbierane.

CSAM to nie pornografia

Eksperci Zespołu Dyżurnet.pl nie używają terminu „pornografia dziecięca”, zastępując go sformułowaniem „treści przedstawiające seksualne wykorzystanie dzieci”. Podkreślają w ten sposób, że to ofiara jest w centrum troski, że taki materiał to nie jest rozrywka. Najważniejsza jest krzywda realnego dziecka, a to co analizują specjaliści jest zapisem przestępstwa i tak powinno być traktowane.

- Każda ofiara powinna mieć pewność, że jest chroniona i że są zespoły, które dopełnią wszystkiego, aby te materiały nie pojawiały się wtórnie w internecie – deklaruje kierownik zespołu Dyżurnet.pl.

W polskim prawie zabronione jest posiadanie oraz dostęp do CSAM, nawet jeśli są to animacje, fotomontaże, sztucznie wytworzone materiały – przypominają specjaliści z Dyżurnet.pl.

Projekt APAKT trwa od czerwca 2020 r. Zakończy się w maju 2023 r.

 

Posłuchaj rozmowy z Martyną Różycką i Weroniką Gutfeter w podcaście "Internetowe Rozmowy".

 

Zapraszamy też do posłuchania pozostałych odcinków!