Marketing / Komunikacja / PR

Praktykant /-tka ds. Uczenia maszynowego

5000 PLN brutto miesięcznie

Warszawa
umowa o praktyki
pełen etat
junior
praca hybrydowa

Zakład Bezpieczeństwa i Przejrzystości Sztucznej Inteligencji zaprasza ambitnych /-tne studentów /-tki i absolwentów /-tki studiów magisterskich na staż, podczas którego opracowane zostanie prototypowe rozwiązanie umożliwiające identyfikację danych treningowych, użytych do treningu dużych modeli, co ma szczególne znaczenie w kontekście prywatności danych.

Obecnie trwa intensywny wyścig technologiczny w zakresie możliwości dużych modeli językowych (LLM). Najwięksi gracze na rynku, tacy jak Google, OpenAI czy Anthropic, publikują swoje modele wraz z wynikami na popularnych benchmarkach testowych, takich jak MMLU, ARC czy HELM. Istnieje jednak ryzyko, że modele te są trenowane z wykorzystaniem danych testowych, co może prowadzić do sztucznie zawyżonych wyników i naruszenia zasad rzetelności naukowej. Celem projektu jest zbadanie tych praktyk poprzez zastosowanie metod wykrywania przecieków danych, opracowanych przez członka naszego zespołu Jana Dubińskiego.

W ramach prac planowane jest również wykorzystanie danych z projektu PLLuM w celu oceny skuteczności proponowanych algorytmów na rzeczywistych zbiorach danych. Projekt ma charakter badawczo-rozwojowy i wpisuje się w strategiczne działania NASK w zakresie bezpieczeństwa sztucznej inteligencji.

Aplikuj teraz

Zadania:

Wstępna analiza literatury i przegląd istniejących rozwiązań
Przygotowanie i przetwarzanie zbiorów danych
Implementacja, adaptacja i dostrajanie modeli językowych na wybranych zadaniach
Projektowanie i implementacja benchmarków ewaluacyjnych z naciskiem na bezpieczeństwo i kontrolowalność modeli
Analiza wyników eksperymentów i opracowanie raportów z postępów, przygotowanie publikacji naukowej podsumowującej projekt

Wymagania:

Status studenta lub absolwenta studiów magisterskich, preferowane kierunki: informatyka, matematyka lub pokrewne
Wiedza z zakresu przetwarzania języka naturalnego i/lub wizji komputerowej, w szczególności znajomość modeli językowych opartych na architekturze Transformer
Doświadczenie w pracy z Pythonem i bibliotekami do uczenia maszynowego (PyTorch, Hugging Face Transformers)
Umiejętność pracy z dużymi zbiorami danych
Znajomość języka angielskiego na poziomie umożliwiającym czytanie literatury naukowej

Mile widziane doświadczenie w pracy z dużymi modelami

Oferujemy:

3-miesięczny staż w Zakładzie Bezpieczeństwa i Przejrzystości Sztucznej Inteligencji w Centrum Badań i Rozwoju NASK PIB: 1.10. – 31.12.2025 r.
Staż w pełnym wymiarze 40 godzin tygodniowo
Wynagrodzenie: maksymalnie 5000 PLN miesięcznie, kwota zależna od przepracowanych godzin

Benefity

Zapewniamy dobre warunki pracy

O właściwych ludzi trzeba odpowiednio dbać. Dlatego oferujemy cały szereg dodatkowych korzyści. Od szkoleń i kursów zawodowych, poprzez zajęcia z jogi i owocowe czwartki, po dofinansowaną kartę Multisport albo zwrot za bilety do kina czy teatru. To wszystko jest jednak dodatkiem do tego, że po prostu dobrze się z nami pracuje.