Grupa ludzi podczas rozmowy
Marketing / Komunikacja / PR

Praktykant /-tka ds. Uczenia maszynowego

5000 PLN brutto miesięcznie

  • Warszawa
  • umowa o praktyki
  • pełen etat
  • junior
  • praca hybrydowa

Zakład Bezpieczeństwa i Przejrzystości Sztucznej Inteligencji zaprasza ambitnych /-tne studentów /-tki i absolwentów /-tki studiów magisterskich na staż, podczas którego opracowane zostanie prototypowe rozwiązanie umożliwiające identyfikację danych treningowych, użytych do treningu dużych modeli, co ma szczególne znaczenie w kontekście prywatności danych.

Obecnie trwa intensywny wyścig technologiczny w zakresie możliwości dużych modeli językowych (LLM). Najwięksi gracze na rynku, tacy jak Google, OpenAI czy Anthropic, publikują swoje modele wraz z wynikami na popularnych benchmarkach testowych, takich jak MMLU, ARC czy HELM. Istnieje jednak ryzyko, że modele te są trenowane z wykorzystaniem danych testowych, co może prowadzić do sztucznie zawyżonych wyników i naruszenia zasad rzetelności naukowej. Celem projektu jest zbadanie tych praktyk poprzez zastosowanie metod wykrywania przecieków danych, opracowanych przez członka naszego zespołu Jana Dubińskiego.

W ramach prac planowane jest również wykorzystanie danych z projektu PLLuM w celu oceny skuteczności proponowanych algorytmów na rzeczywistych zbiorach danych. Projekt ma charakter badawczo-rozwojowy i wpisuje się w strategiczne działania NASK w zakresie bezpieczeństwa sztucznej inteligencji.

Zadania:

  • Wstępna analiza literatury i przegląd istniejących rozwiązań
  • Przygotowanie i przetwarzanie zbiorów danych
  • Implementacja, adaptacja i dostrajanie modeli językowych na wybranych zadaniach
  • Projektowanie i implementacja benchmarków ewaluacyjnych z naciskiem na bezpieczeństwo i kontrolowalność modeli
  • Analiza wyników eksperymentów i opracowanie raportów z postępów, przygotowanie publikacji naukowej podsumowującej projekt

Wymagania:

  • Status studenta lub absolwenta studiów magisterskich, preferowane kierunki: informatyka, matematyka lub pokrewne
  • Wiedza z zakresu przetwarzania języka naturalnego i/lub wizji komputerowej, w szczególności znajomość modeli językowych opartych na architekturze Transformer
  • Doświadczenie w pracy z Pythonem i bibliotekami do uczenia maszynowego (PyTorch, Hugging Face Transformers)
  • Umiejętność pracy z dużymi zbiorami danych
  • Znajomość języka angielskiego na poziomie umożliwiającym czytanie literatury naukowej

Mile widziane doświadczenie w pracy z dużymi modelami

Oferujemy:

  • 3-miesięczny staż w Zakładzie Bezpieczeństwa i Przejrzystości Sztucznej Inteligencji w Centrum Badań i Rozwoju NASK PIB: 1.10. – 31.12.2025 r.
  • Staż w pełnym wymiarze 40 godzin tygodniowo
  • Wynagrodzenie: maksymalnie 5000 PLN miesięcznie, kwota zależna od przepracowanych godzin
Benefity

Zapewniamy dobre warunki pracy

O właściwych ludzi trzeba odpowiednio dbać. Dlatego oferujemy cały szereg dodatkowych korzyści. Od szkoleń i kursów zawodowych, poprzez zajęcia z jogi i owocowe czwartki, po dofinansowaną kartę Multisport albo zwrot za bilety do kina czy teatru. To wszystko jest jednak dodatkiem do tego, że po prostu dobrze się z nami pracuje.

icon_pace
Elastyczne godziny pracy

Zaczynamy między 7 a 10 rano.

icon_balance
Równowaga między pracą a życiem

Dbamy o zachowanie zdrowego podejścia do obowiązków służbowych.

icon_model_training
Szkolenia i konferencje

Daje możliwość podnoszenia swoich kompetencji.

icon_school
Ciekawe projekty

Działamy na pograniczu nauki, cyberbezpieczeństwa i nowych technologii.

icon_medical
Opieka medyczna

Każdy pracownik ma możliwość korzystania z prywatnej opieki medycznej

icon_fitness_center
Karta Multisport

Zachęcamy do aktywności sportowej lub uzyskania zwrotu za wydatki poniesione na kulturę.

icon_landscape
Dofinansowanie wypoczynku

Zwracamy część kosztów związanych z urlopem (tzw. wakacje pod gruszą).

icon_beach_access
Ubezpieczenie na życie

Dajemy możliwość zawarcia dodatkowego ubezpieczenia na życie.