Unia Europejska
Typ_aktualnosc Aktualność
19 Stycznia 2026|8 min. czytania

Od modeli do wdrożeń – PLLuM na ścieżce realnych zastosowań

PLLuM wspiera już w codziennej pracy urzędników w Gdyni i Poznaniu, a także miliony użytkowników aplikacji mObywatel. Podczas drugiego śniadania z PLLuMem podsumowano postępy w rozwoju polskiej sztucznej inteligencji. Uczestnicy spotkania poznali rezultaty projektu HIVE AI, plany publikacji nowych modeli oraz doświadczenia z pilotażowych wdrożeń.

Prelegentka trzyma mikrofon i stoi obok ekranu z prezentacją „Modele PLLuM gotowe do publikacji”; na slajdzie widoczne są warianty modeli PLLuM i Llama-PLLuM w formie kolorowych bloków, a na pierwszym planie siedzi publiczność.
Łuna gradientu wychodząca od dołu

– Mamy zasoby, plan i pomysły – mówił podczas rozpoczęcia spotkania podsumowującego projekt PLLuM Radosław Nielek, dyrektor NASK. – Nie jesteśmy w połowie drogi, nawet w jednej czwartej – jesteśmy na jej początku, a przed nami ogrom pracy. Będziemy dążyć w stronę horyzontu, który wyznaczają dynamicznie rozwijające się modele sztucznej inteligencji.

PLLuM to odpowiedź na konkretne zapotrzebowania.

– Administracja publiczna w Polsce potrzebuje automatyzacji i usprawnienia pracy. Projekty takie jak PLLuM to szansa na rozwój kompetencji nie tylko naukowców, ale i pracowników samorządowych. Polska nie może się zatrzymywać; musi stawiać na rozwiązania, które budują nowoczesne państwo – mówiła Aleksandra Tomaszewska, zastępczyni dyrektora Departamentu Badań i Innowacji w Ministerstwie Cyfryzacji.

Podsumowanie projektu HIVE AI

Wyniki prac konsorcjum zaprezentowali dr Agnieszka Karlińska, kierowniczka Zakładu Dużych Modeli Językowych w NASK i kierowniczka HIVE AI, oraz dr hab. Piotr Pęzik, prof. Uniwersytetu Łódzkiego, kierownik operacyjny.

W trakcie trwania projektu:

  • opublikowano 8 nowych modeli PLLuM, w tym 5 na licencjach w pełni otwartych;
  • udostępniono dwa autorskie zbiory danych do dostrajania i wychowania LLM-ów (ang. alignment) – PLLuMIC oraz PLLuM-Align – wraz ze szczegółowym opisem metodologii ich tworzenia;
  • przekazano do testów dwa prototypy inteligentnego asystenta obywatelskiego.

To jednak tylko część rezultatów. Kolejnych 11 modeli jest gotowych do publikacji. Będą to nowe odsłony sprawdzonych modeli PLLuM o rozmiarach 8, 12 i 70 miliardów parametrów, a także nowość w rodzinie – model o rozmiarze 4 miliardów parametrów.

– Mniejszy model stworzyliśmy z myślą o instytucjach z ograniczoną infrastrukturą obliczeniową. To efektywne narzędzie do konkretnych zadań, takich jak choćby klasyfikacja dokumentów – wyjaśniała dr Agnieszka Karlińska.

Premiera nowych modeli planowana jest na koniec stycznia. Udostępnione zostaną na szerokich licencjach, które pozwolą na zastosowania komercyjne. Kierownicy projektu zapowiedzieli również publikację kolejnych podzbiorów danych do dostrajania modeli oraz autorskiej aplikacji do anotacji instrukcji i preferencji. Już dziś odświeżone wersje PLLuM 12B-nc oraz PLLuM 8x7B-nc, a więc modeli opracowanych dla celów badawczych, są dostępne w aplikacji PLLuM Chat.

Nowe dane, nowe kompetencje

Nowe modele PLLuM trenowane były na rozszerzonych i zaktualizowanych zbiorach danych, dlatego lepiej radzą sobie z zadaniami.

– Pozyskaliśmy nowe korpusy do pretreningu, sięgając po nieoczywiste źródła, takie jak dokumenty wyodrębnione z załączników publikowanych na portalach rządowych i w Biuletynach Informacji Publicznej. Zakupiliśmy również wysokiej jakości dane prasowe od wydawców oraz zaktualizowaliśmy dotychczasowe źródła. Istotnym elementem prac była rygorystyczna weryfikacja licencji oraz zastrzeżeń związanych z eksploracją tekstów i danych (TDM), prowadzona w zgodzie z wymogami unijnego AI Act i polskiego prawa autorskiego. Równolegle pracowaliśmy nad nowymi danymi do posttreningu. Postawiliśmy na instrukcje i preferencje tworzone ręcznie według ścisłych wytycznych. Naszym celem było nauczenie modeli realizacji nowych zadań – przede wszystkim generatywnych – przy zachowaniu wysokiej poprawności językowej – wyjaśniała podczas spotkania dr Agnieszka Karlińska.

Nowe kompetencje modeli PLLuM obejmują przede wszystkim:

  • tworzenie tekstów prawniczych i urzędowych,
  • realizację zadań biurowo-administracyjnych,
  • upraszczanie języka.

Punktem wyjścia były potrzeby polskiej administracji, ale zespół rozwijający PLLuM patrzył szerzej. Modele trenowano także pod kątem tworzenia treści, rozumowania i pracy w scenariuszach opartych na mechanizmach RAG. Zakres tych zadań ustalono na podstawie analizy użycia aplikacji PLLuM Chat – od końca lutego 2025 roku użytkownicy zadali tam modelom ponad 1,6 mln pytań.

Modele od podstaw i współpraca z Mistral AI

Jednym z najbardziej ambitnych przedsięwzięć zrealizowanych w ramach projektu HIVE AI był trening modelu o rozmiarze 24 miliardów parametrów od wag losowych.

– Polskojęzyczne LLM-y powstawały dotychczas poprzez adaptację wielojęzycznych modeli fundamentalnych. To podejście skuteczne, ale ograniczające transparentność – tłumaczyła dr Karlińska. – Chcieliśmy sprawdzić, czy w polskich warunkach da się zbudować model od zera, wyłącznie na własnych danych. Wierzymy, że pomoże to lepiej zrozumieć, jak działają duże modele językowe.

W pełni transparentny model PLLuM, trenowany na około 850 miliardach tokenów w języku polskim i angielskim, zostanie udostępniony jeszcze w tym miesiącu.

Nieco później ukaże się model opracowany we współpracy z francuską firmą Mistral AI, zajmującą się tworzeniem otwartych, wielojęzycznych modeli językowych. Mimo formalnego zakończenia projektu HIVE AI trwają intensywne prace nad modelem o roboczej nazwie Polstral. Jest to adaptacja językowa modelu bazowego Mistral-Small-24B, przeprowadzona na stosunkowo dużej puli wysokiej jakości danych angielskich i polskich (ok. 700 miliardów tokenów), z których znaczną część dostarczył właśnie Mistral AI.

Prelegent z mikrofonem w ręku prezentuje wykresy na slajdzie.
dr hab. Piotr Pęzik, prof. Uniwersytetu Łódzkiego, kierownik operacyjny HIVE AI

– Co ważne, dzięki współpracy z zespołem inżynierów firmy Mistral AI dane te zostały dobrane w taki sposób, aby uniknąć tzw. problemu katastrofalnego zapominania wiedzy i umiejętności modeli w procesie dostrajania – mówił prof. Piotr Pęzik, kierownik operacyjny HIVE AI. – Spodziewamy się, że Polstral będzie równie dobry w zadaniach ogólnych jak modele instrukcyjne z serii Mistral-Small, a jednocześnie ponadprzeciętny w generowaniu szerokiego spektrum gatunków tekstów w języku polskim, w tym tekstów z domeny urzędowej. Osobiście jestem zwolennikiem celowanej adaptacji językowej – uważam, że modele niewielkich i średnich rozmiarów mogą być dobre w zadaniach generatywnych, w odróżnieniu od pasywnego rozumienia i przetwarzania treści, w maksymalnie kilku wybranych językach – dodaje.

W prace nad nowym modelem zaangażowani są eksperci z NASK, Uniwersytetu Łódzkiego, ACK Cyfronet oraz Politechniki Wrocławskiej.

Plany na przyszłość

W tym roku projekt PLLuM skoncentruje się na dwóch filarach: wdrożeniowym oraz badawczym. Priorytetem jest budowa aktywnego ekosystemu współpracy i społeczności, która pozwoli na realne wykorzystanie modeli w administracji publicznej (m.in. w aplikacji mObywatel) oraz samorządach.

– W planach badawczych kluczowe miejsce zajmuje stworzenie pierwszego polskiego komercyjnego modelu wizyjno-językowego oraz dalsza, rygorystyczna ewaluacja jakości danych – mówił Wojciech Kusa, kierownik Zakładu Inżynierii Lingwistycznej i Analizy Tekstu NASK. – Sukces tych rozwiązań zależy od ścisłej współpracy między nauką a sektorem publicznym, dlatego twórcy otwierają się na wspólne budowanie zbiorów danych i wymianę doświadczeń poprzez nową platformę współpracy.

Prelegent z mikrofonem w ręku na tle slajdu.
Wojciech Kusa, kierownik Zakładu Inżynierii Lingwistycznej i Analizy Tekstu NASK

Kolejnym elementem nadchodzących działań jest intensyfikacja wdrożeń w administracji publicznej, ze szczególnym uwzględnieniem aplikacji mObywatel. Planowany rozwój tego największego wdrożenia obejmuje nie tylko dodawanie nowych funkcjonalności czatbota, ale przede wszystkim podniesienie rygoru naukowego poprzez zaawansowane testy i ewaluację poprawności. Równolegle, bazując na sukcesach w Gdyni i Poznaniu, projekt otwiera się na współpracę z kolejnymi jednostkami samorządowymi.

Wdrożenia modeli PLLuM

W projekcie HIVE AI nauka od razu spotyka się z praktyką – badania od początku miały swój konkretny cel wdrożeniowy. Modele PLLuM zostały pilotażowo udostępnione w:

  • Ministerstwie Cyfryzacji w formie wewnętrznego asystenta;
  • w dwóch urzędach miejskich – Gdyni oraz Poznania;
  • aplikacji mObywatel jako wirtualny asystent, który rozwijany jest przez Centralny Ośrodek Informatyki.

W Gdyni dostrojona do potrzeb urzędu wersja modelu PLLuM zasiliła miejską wyszukiwarkę. Mieszkańcy mogą zadawać pytania w języku naturalnym, a system wskazuje odpowiednie dokumenty z Biuletynu Informacji Publicznej.

W Poznaniu modele PLLuM pomagają urzędnikom szybciej wyszukiwać informacje i sprawniej odpowiadać na pytania mieszkańców. Pilotażowe wdrożenie zrealizowano z użyciem aplikacji ShpaRAG, która wspiera szybkie prototypowanie i testowanie rozwiązań typu RAG. W trakcie pilotażu około 90% odpowiedzi asystenta okazało się w pełni poprawnych.

W aplikacji mObywatel modele PLLuM wspierają ponad 10 milionów użytkowników, pomagając znaleźć właściwe wnioski i formularze. Podpowiadają też jak załatwić formalności czy informują o możliwościach aplikacji.

Bądź częścią społeczności PLLuM! Zapisz się do newslettera tutaj, aby nie przegapić żadnych aktualności.

Udostępnij ten post

Wyróżnione aktualności

Paweł Kostkiewicz
Typ_aktualnosc Aktualność
02 Kwietnia 2026|7 min. czytania

Razem dla bezpieczeństwa sieci 5G – warsztaty 5G TACTIC w NASK

5G ma napędzać transport, przemysł, administrację, a za chwilę – rzeczy, których jeszcze nawet nie nazywamy. Problem w tym, że im więcej od tej technologii zależy, tym mniej miejsca zostaje na pomyłki.

Grafika z kołami mającymi symbolizować nowoczesne przesyłanie informacji.
Typ_aktualnosc Aktualność
27 Marca 2026|4 min. czytania

Transgraniczna autostrada danych. Ruszył projekt QKD Germany‑Poland‑Czechia

Czy istnieje rozmowa, której nie da się podsłuchać albo informacje, których nie da się przechwycić? W niedalekiej przyszłości powstanie pierwsza tak rozbudowana sieć kwantowa w Europie Środkowej, która wykorzysta technologię generowania i dystrybucji kluczy kryptograficznych. To oznacza bezpieczne przesyłanie informacji międzynarodowych. NASK jest partnerem tej inicjatywy.

Dyrektor i Minister oglądają komputer
Typ_aktualnosc Aktualność
23 Marca 2026|7 min. czytania

Moc obliczeniowa dla polskiej AI. Pierwszy superkomputer NASK wystartował

NASK uruchomił nowy klaster do obliczeń AI. Wart 30 milionów złotych projekt to inwestycja w zdolność prowadzenia badań, tworzenia własnych narzędzi i rozwijania technologii, które odpowiadają na konkretne potrzeby państwa i obywateli.

Trzech mężczyzn w garniturach ściska dłonie podczas wydarzenia z okazji 30-lecia CERT Polska; w tle widoczna grafika z napisem „30 lat CERT Polska” oraz logotypy NASK i Ministerstwa Cyfryzacji.
Typ_aktualnosc Aktualność
11 Marca 2026|8 min. czytania

Cyberbezpiecznie od 30 lat. CERT Polska

Od 12 incydentów w 1996 roku, po przeszło 260 tysięcy w ubiegłym. Te liczby najlepiej pokazują, jak diametralnie zmieniła się skala cyberataków oraz rola CERT Polska w podnoszeniu świadomości o cyberbezpieczeństwie. Pierwszy w Polsce zespół reagowania na zagrożenia w sieci, który powstał w NASK, obchodzi właśnie 30 urodziny.

Informacje

Najnowsze aktualności

DSC02109
Typ_aktualnosc Aktualność
14 Maja 2026|8 min. czytania

NASK na Impact’26. Technologia po właściwej stronie

– W tym roku przyjechaliśmy na Impact z wyjątkową agendą, bo zależało nam na tym, aby w atrakcyjny i angażujący sposób opowiedzieć o tym, czym zajmujemy się na co dzień. Za nami inspirujące debaty poświęcone twórcom i sztucznej inteligencji, cyberbezpieczeństwu oraz wyzwaniom, jakie niesie cyfrowy świat – podsumowywał obecność NASK na Impact’26 szef instytutu Radosław Nielek.

Material-Dowodowy-Cyfrowy-Paraliz
Typ_aktualnosc Aktualność
12 Maja 2026|1 min. czytania

"Cyfrowy paraliż". Podcast Radia ZET o cyberataku na szpital w Łodzi

 Inspirujaca współpraca NASK z Radiem Zet przenosi temat cyberprzestępczości do świata podcastów. Dziennikarz i podcaster kryminalny popularnej „zetki”  Mateusz Kapera stworzył materiał o ataku hakerskim na Instytut Centrum Zdrowia Matki Polki w Łodzi. Niebagatelną rolę w przywracaniu szpitala do normalności odegrał zespół CERT Polska, który działa w ramach NASK.

Logo NASK i Impact’26 na różowo-pomarańczowym gradientowym tle.
Typ_aktualnosc Aktualność
12 Maja 2026|7 min. czytania

Anatomia cyberprzestępstw. NASK na Impact'26

Czy ten tekst napisała AI? Nie. Ale dziś pisze całe książki i bez problemu naśladuje styl Katarzyny Puzyńskiej, autorki bestsellerów. Co zrobić, gdy hakerzy żądają wielomilionowego okupu w zamian za odblokowanie systemu w jednym z największych szpitali dziecięcych w Polsce? I co łączy te sprawy? Odpowiedź jest jedna – NASK. A dlaczego i w jaki sposób – o tym na stoisku NASK na Impact’26.