
Praktykant /-tka ds. Uczenia maszynowego
5000 PLN brutto miesięcznie
- Warszawa
- umowa o praktyki
- pełen etat
- junior
- praca hybrydowa
Zakład Bezpieczeństwa i Przejrzystości Sztucznej Inteligencji zaprasza ambitnych /-tne studentów /-tki i absolwentów /-tki studiów magisterskich na staż, podczas którego opracowane zostanie prototypowe rozwiązanie umożliwiające identyfikację danych treningowych, użytych do treningu dużych modeli, co ma szczególne znaczenie w kontekście prywatności danych.
Obecnie trwa intensywny wyścig technologiczny w zakresie możliwości dużych modeli językowych (LLM). Najwięksi gracze na rynku, tacy jak Google, OpenAI czy Anthropic, publikują swoje modele wraz z wynikami na popularnych benchmarkach testowych, takich jak MMLU, ARC czy HELM. Istnieje jednak ryzyko, że modele te są trenowane z wykorzystaniem danych testowych, co może prowadzić do sztucznie zawyżonych wyników i naruszenia zasad rzetelności naukowej. Celem projektu jest zbadanie tych praktyk poprzez zastosowanie metod wykrywania przecieków danych, opracowanych przez członka naszego zespołu Jana Dubińskiego.
W ramach prac planowane jest również wykorzystanie danych z projektu PLLuM w celu oceny skuteczności proponowanych algorytmów na rzeczywistych zbiorach danych. Projekt ma charakter badawczo-rozwojowy i wpisuje się w strategiczne działania NASK w zakresie bezpieczeństwa sztucznej inteligencji.
Zadania:
- Wstępna analiza literatury i przegląd istniejących rozwiązań
- Przygotowanie i przetwarzanie zbiorów danych
- Implementacja, adaptacja i dostrajanie modeli językowych na wybranych zadaniach
- Projektowanie i implementacja benchmarków ewaluacyjnych z naciskiem na bezpieczeństwo i kontrolowalność modeli
- Analiza wyników eksperymentów i opracowanie raportów z postępów, przygotowanie publikacji naukowej podsumowującej projekt
Wymagania:
- Status studenta lub absolwenta studiów magisterskich, preferowane kierunki: informatyka, matematyka lub pokrewne
- Wiedza z zakresu przetwarzania języka naturalnego i/lub wizji komputerowej, w szczególności znajomość modeli językowych opartych na architekturze Transformer
- Doświadczenie w pracy z Pythonem i bibliotekami do uczenia maszynowego (PyTorch, Hugging Face Transformers)
- Umiejętność pracy z dużymi zbiorami danych
- Znajomość języka angielskiego na poziomie umożliwiającym czytanie literatury naukowej
Mile widziane doświadczenie w pracy z dużymi modelami
Oferujemy:
- 3-miesięczny staż w Zakładzie Bezpieczeństwa i Przejrzystości Sztucznej Inteligencji w Centrum Badań i Rozwoju NASK PIB: 1.10. – 31.12.2025 r.
- Staż w pełnym wymiarze 40 godzin tygodniowo
- Wynagrodzenie: maksymalnie 5000 PLN miesięcznie, kwota zależna od przepracowanych godzin
Zapewniamy dobre warunki pracy
O właściwych ludzi trzeba odpowiednio dbać. Dlatego oferujemy cały szereg dodatkowych korzyści. Od szkoleń i kursów zawodowych, poprzez zajęcia z jogi i owocowe czwartki, po dofinansowaną kartę Multisport albo zwrot za bilety do kina czy teatru. To wszystko jest jednak dodatkiem do tego, że po prostu dobrze się z nami pracuje.
Zaczynamy między 7 a 10 rano.
Dbamy o zachowanie zdrowego podejścia do obowiązków służbowych.
Daje możliwość podnoszenia swoich kompetencji.
Działamy na pograniczu nauki, cyberbezpieczeństwa i nowych technologii.
Każdy pracownik ma możliwość korzystania z prywatnej opieki medycznej
Zachęcamy do aktywności sportowej lub uzyskania zwrotu za wydatki poniesione na kulturę.
Zwracamy część kosztów związanych z urlopem (tzw. wakacje pod gruszą).
Dajemy możliwość zawarcia dodatkowego ubezpieczenia na życie.