
Stażysta /-tka NLP
5000 zł. miesięcznie
- Warszawa
- umowa o praktyki
- pełen etat
- staż badawczy
- praca hybrydowa
Oferujemy staż badawczy w Zespole Bezpieczeństwa i Odporności Modeli Językowych. Celem stażu jest uczestnictwo w projekcie rozwijającym model typu guard oraz napisanie na podstawie tych prac publikacji naukowej.
Projekt koncentruje się na modelach nowej generacji - typu guard dla języka polskiego, w początkowej fazie na analizie treści tekstowych, ze szczególnym naciskiem na wykrywanie niebezpiecznych pytań (promptów) oraz ocenę odpowiedzi generowanych przez modele. Rozwiązania tego typu stanowią kluczowy element systemów AI, odpowiadając za ochronę użytkowników, ograniczanie ryzyka nadużyć oraz zwiększanie kontrolowalności modeli generatywnych.
Istotnym elementem projektu będzie stworzenie środowiska ewaluacyjnego, obejmującego leaderboard oraz automatyczne potoki ewaluacyjne, które umożliwią systematyczne porównywanie nowych modeli, ocenę ich bezpieczeństwa oraz weryfikację zgodności z regulacjami prawnymi i wymaganiami dotyczącymi bezpieczeństwa systemów sztucznej inteligencji.
Twój zakres obowiązków:
- Wstępna analiza literatury i przegląd istniejących architektur modeli guard i rozwiązań wykorzystywanych do moderacji treści tekstowych, ze szczególnym uwzględnieniem modeli dostosowanych do języka polskiego
- Przygotowanie, oczyszczenie i rozszerzanie zbiorów danych do zadań guardowych, obejmujących klasyfikację pytań (promptów) i odpowiedzi modeli, wykrywanie naruszeń polityk bezpieczeństwa oraz ocenę ryzyka treści
- Projektowanie i implementacja leaderboardu na platformie HuggingFace, umożliwiającego porównywanie jakości modeli guard na opracowanych zestawach danych oraz monitorowanie postępów kolejnych iteracji modeli
- Dostrajanie modeli guard zarówno na danych zawierających odpowiedzi modeli, jak i na samych promptach użytkownika, w celu zwiększenia skuteczności wczesnego wykrywania niebezpiecznych lub niepożądanych intencji
- Analiza możliwości dalszego rozwoju projektu w kierunku wyspecjalizowanych systemów ochrony treści internetowych dla dzieci i młodzieży, rozwiązań multimodalnych lub innych obszarów zgodnych z zainteresowaniami stażysty i potrzebami zespołu
- Projektowanie i implementacja prototypowego rozwiązania rozwijającego wybrany kierunek specjalizacyjny, np. systemu ochrony treści dla dzieci i młodzieży, guardów multimodalnych
- Analiza wyników eksperymentów i opracowanie raportów z postępów, przygotowanie publikacji naukowej podsumowującej projekt
Nasze wymagania:
- Student lub absolwent studiów magisterskich, preferowane kierunki: informatyka, matematyka lub pokrewne
- Wiedza z zakresu przetwarzania języka naturalnego (NLP), w szczególności znajomość modeli językowych opartych na architekturze Transformer
- Doświadczenie w pracy z Pythonem i bibliotekami do uczenia maszynowego (PyTorch, Hugging Face Transformers)
- Umiejętność pracy z dużymi zbiorami danych tekstowych
- Umiejętność pracy zespołowej, dobra organizacja pracy oraz znajomość języka angielskiego na poziomie umożliwiającym czytanie literatury naukowej
Oferujemy:
- 3-miesięczny staż w Zakładzie naukowym Przetwarzania Języka Naturalnego, w Zespole Bezpieczeństwa i Odporności Modeli Językowych
- Staż w pełnym wymiarze godzin tygodniowo
- Wynagrodzenie 5000 PLN miesięcznie
- Możliwość rozwoju naukowego wraz z publikacją badań
Supportive and Comfortable Work Environment
The right people deserve the right care. That’s why we offer a wide range of extra benefits — from professional training and courses, to yoga sessions and Fruit Thursdays, all the way to co-financed Multisport cards and reimbursements for cinema or theatre tickets. But above all, it simply feels good to work with us.
You can start your day anytime between 7 and 10 a.m.
We believe in maintaining a healthy approach to work. That’s why we support a balanced lifestyle and respect your time outside the office.
We offer opportunities to grow your skills through professional development and industry events.
We operate at the intersection of science, cybersecurity, and emerging technologies.
Each employee has the opportunity to use private medical care services.
Stay active with a co-financed Multisport card or get reimbursed for cultural activities like cinema and theatre visits.
We offer partial reimbursement of vacation costs — including Poland’s traditional “under the pear tree” benefit.
You can opt in to additional life insurance coverage, giving you and your loved ones greater peace of mind.