
Stażysta /-tka NLP
5000 zł. miesięcznie
- Warszawa
- umowa o praktyki
- pełen etat
- staż badawczy
- praca hybrydowa
Oferujemy staż badawczy w Zespole Bezpieczeństwa i Odporności Modeli Językowych. Celem stażu jest uczestnictwo w projekcie rozwijającym model typu guard oraz napisanie na podstawie tych prac publikacji naukowej.
Projekt koncentruje się na modelach nowej generacji - typu guard dla języka polskiego, w początkowej fazie na analizie treści tekstowych, ze szczególnym naciskiem na wykrywanie niebezpiecznych pytań (promptów) oraz ocenę odpowiedzi generowanych przez modele. Rozwiązania tego typu stanowią kluczowy element systemów AI, odpowiadając za ochronę użytkowników, ograniczanie ryzyka nadużyć oraz zwiększanie kontrolowalności modeli generatywnych.
Istotnym elementem projektu będzie stworzenie środowiska ewaluacyjnego, obejmującego leaderboard oraz automatyczne potoki ewaluacyjne, które umożliwią systematyczne porównywanie nowych modeli, ocenę ich bezpieczeństwa oraz weryfikację zgodności z regulacjami prawnymi i wymaganiami dotyczącymi bezpieczeństwa systemów sztucznej inteligencji.
Twój zakres obowiązków:
- Wstępna analiza literatury i przegląd istniejących architektur modeli guard i rozwiązań wykorzystywanych do moderacji treści tekstowych, ze szczególnym uwzględnieniem modeli dostosowanych do języka polskiego
- Przygotowanie, oczyszczenie i rozszerzanie zbiorów danych do zadań guardowych, obejmujących klasyfikację pytań (promptów) i odpowiedzi modeli, wykrywanie naruszeń polityk bezpieczeństwa oraz ocenę ryzyka treści
- Projektowanie i implementacja leaderboardu na platformie HuggingFace, umożliwiającego porównywanie jakości modeli guard na opracowanych zestawach danych oraz monitorowanie postępów kolejnych iteracji modeli
- Dostrajanie modeli guard zarówno na danych zawierających odpowiedzi modeli, jak i na samych promptach użytkownika, w celu zwiększenia skuteczności wczesnego wykrywania niebezpiecznych lub niepożądanych intencji
- Analiza możliwości dalszego rozwoju projektu w kierunku wyspecjalizowanych systemów ochrony treści internetowych dla dzieci i młodzieży, rozwiązań multimodalnych lub innych obszarów zgodnych z zainteresowaniami stażysty i potrzebami zespołu
- Projektowanie i implementacja prototypowego rozwiązania rozwijającego wybrany kierunek specjalizacyjny, np. systemu ochrony treści dla dzieci i młodzieży, guardów multimodalnych
- Analiza wyników eksperymentów i opracowanie raportów z postępów, przygotowanie publikacji naukowej podsumowującej projekt
Nasze wymagania:
- Student lub absolwent studiów magisterskich, preferowane kierunki: informatyka, matematyka lub pokrewne
- Wiedza z zakresu przetwarzania języka naturalnego (NLP), w szczególności znajomość modeli językowych opartych na architekturze Transformer
- Doświadczenie w pracy z Pythonem i bibliotekami do uczenia maszynowego (PyTorch, Hugging Face Transformers)
- Umiejętność pracy z dużymi zbiorami danych tekstowych
- Umiejętność pracy zespołowej, dobra organizacja pracy oraz znajomość języka angielskiego na poziomie umożliwiającym czytanie literatury naukowej
Oferujemy:
- 3-miesięczny staż w Zakładzie naukowym Przetwarzania Języka Naturalnego, w Zespole Bezpieczeństwa i Odporności Modeli Językowych
- Staż w pełnym wymiarze godzin tygodniowo
- Wynagrodzenie 5000 PLN miesięcznie
- Możliwość rozwoju naukowego wraz z publikacją badań
Zapewniamy dobre warunki pracy
O właściwych ludzi trzeba odpowiednio dbać. Dlatego oferujemy cały szereg dodatkowych korzyści. Od szkoleń i kursów zawodowych, poprzez zajęcia z jogi i owocowe czwartki, po dofinansowaną kartę Multisport albo zwrot za bilety do kina czy teatru. To wszystko jest jednak dodatkiem do tego, że po prostu dobrze się z nami pracuje.
Zaczynamy między 7 a 10 rano.
Dbamy o zachowanie zdrowego podejścia do obowiązków służbowych.
Daje możliwość podnoszenia swoich kompetencji.
Działamy na pograniczu nauki, cyberbezpieczeństwa i nowych technologii.
Każdy pracownik ma możliwość korzystania z prywatnej opieki medycznej
Zachęcamy do aktywności sportowej lub uzyskania zwrotu za wydatki poniesione na kulturę.
Zwracamy część kosztów związanych z urlopem (tzw. wakacje pod gruszą).
Dajemy możliwość zawarcia dodatkowego ubezpieczenia na życie.