Unia Europejska
Grupa ludzi podczas rozmowy
Inne

Stażysta /-tka NLP

5000 zł. miesięcznie

  • Warszawa
  • umowa o praktyki
  • pełen etat
  • staż badawczy
  • praca hybrydowa

Oferujemy staż badawczy w Zespole Bezpieczeństwa i Odporności Modeli Językowych. Celem stażu jest uczestnictwo w projekcie rozwijającym model typu guard oraz napisanie na podstawie tych prac publikacji naukowej.

Projekt koncentruje się na modelach nowej generacji - typu guard dla języka polskiego, w początkowej fazie na analizie treści tekstowych, ze szczególnym naciskiem na wykrywanie niebezpiecznych pytań (promptów) oraz ocenę odpowiedzi generowanych przez modele. Rozwiązania tego typu stanowią kluczowy element systemów AI, odpowiadając za ochronę użytkowników, ograniczanie ryzyka nadużyć oraz zwiększanie kontrolowalności modeli generatywnych.

Istotnym elementem projektu będzie stworzenie środowiska ewaluacyjnego, obejmującego leaderboard oraz automatyczne potoki ewaluacyjne, które umożliwią systematyczne porównywanie nowych modeli, ocenę ich bezpieczeństwa oraz weryfikację zgodności z regulacjami prawnymi i wymaganiami dotyczącymi bezpieczeństwa systemów sztucznej inteligencji.

Twój zakres obowiązków:

  • Wstępna analiza literatury i przegląd istniejących architektur modeli guard i rozwiązań wykorzystywanych do moderacji treści tekstowych, ze szczególnym uwzględnieniem modeli dostosowanych do języka polskiego
  • Przygotowanie, oczyszczenie i rozszerzanie zbiorów danych do zadań guardowych, obejmujących klasyfikację pytań (promptów) i odpowiedzi modeli, wykrywanie naruszeń polityk bezpieczeństwa oraz ocenę ryzyka treści
  • Projektowanie i implementacja leaderboardu na platformie HuggingFace, umożliwiającego porównywanie jakości modeli guard na opracowanych zestawach danych oraz monitorowanie postępów kolejnych iteracji modeli
  • Dostrajanie modeli guard zarówno na danych zawierających odpowiedzi modeli, jak i na samych promptach użytkownika, w celu zwiększenia skuteczności wczesnego wykrywania niebezpiecznych lub niepożądanych intencji
  • Analiza możliwości dalszego rozwoju projektu w kierunku wyspecjalizowanych systemów ochrony treści internetowych dla dzieci i młodzieży, rozwiązań multimodalnych lub innych obszarów zgodnych z zainteresowaniami stażysty i potrzebami zespołu
  • Projektowanie i implementacja prototypowego rozwiązania rozwijającego wybrany kierunek specjalizacyjny, np. systemu ochrony treści dla dzieci i młodzieży, guardów multimodalnych
  • Analiza wyników eksperymentów i opracowanie raportów z postępów, przygotowanie publikacji naukowej podsumowującej projekt

Nasze wymagania:

  • Student lub absolwent studiów magisterskich, preferowane kierunki: informatyka, matematyka lub pokrewne
  • Wiedza z zakresu przetwarzania języka naturalnego (NLP), w szczególności znajomość modeli językowych opartych na architekturze Transformer
  • Doświadczenie w pracy z Pythonem i bibliotekami do uczenia maszynowego (PyTorch, Hugging Face Transformers)
  • Umiejętność pracy z dużymi zbiorami danych tekstowych
  • Umiejętność pracy zespołowej, dobra organizacja pracy oraz znajomość języka angielskiego na poziomie umożliwiającym czytanie literatury naukowej

Oferujemy:

  • 3-miesięczny staż w Zakładzie naukowym Przetwarzania Języka Naturalnego, w Zespole Bezpieczeństwa i Odporności Modeli Językowych
  • Staż w pełnym wymiarze godzin tygodniowo
  • Wynagrodzenie 5000 PLN miesięcznie
  • Możliwość rozwoju naukowego wraz z publikacją badań
Benefity

Zapewniamy dobre warunki pracy

O właściwych ludzi trzeba odpowiednio dbać. Dlatego oferujemy cały szereg dodatkowych korzyści. Od szkoleń i kursów zawodowych, poprzez zajęcia z jogi i owocowe czwartki, po dofinansowaną kartę Multisport albo zwrot za bilety do kina czy teatru. To wszystko jest jednak dodatkiem do tego, że po prostu dobrze się z nami pracuje.

icon_pace
Elastyczne godziny pracy

Zaczynamy między 7 a 10 rano.

icon_balance
Równowaga między pracą a życiem

Dbamy o zachowanie zdrowego podejścia do obowiązków służbowych.

icon_model_training
Szkolenia i konferencje

Daje możliwość podnoszenia swoich kompetencji.

icon_school
Ciekawe projekty

Działamy na pograniczu nauki, cyberbezpieczeństwa i nowych technologii.

icon_medical
Opieka medyczna

Każdy pracownik ma możliwość korzystania z prywatnej opieki medycznej

icon_fitness_center
Karta Multisport

Zachęcamy do aktywności sportowej lub uzyskania zwrotu za wydatki poniesione na kulturę.

icon_landscape
Dofinansowanie wypoczynku

Zwracamy część kosztów związanych z urlopem (tzw. wakacje pod gruszą).

icon_beach_access
Ubezpieczenie na życie

Dajemy możliwość zawarcia dodatkowego ubezpieczenia na życie.