19 Stycznia 2026|8 min. czytania

Od modeli do wdrożeń – PLLuM na ścieżce realnych zastosowań

PLLuM wspiera już w codziennej pracy urzędników w Gdyni i Poznaniu, a także miliony użytkowników aplikacji mObywatel. Podczas drugiego śniadania z PLLuMem podsumowano postępy w rozwoju polskiej sztucznej inteligencji. Uczestnicy spotkania poznali rezultaty projektu HIVE AI, plany publikacji nowych modeli oraz doświadczenia z pilotażowych wdrożeń.

Cyfryzacja HIVE AI Instytut Sztuczna inteligencja

Prelegentka trzyma mikrofon i stoi obok ekranu z prezentacją „Modele PLLuM gotowe do publikacji”; na slajdzie widoczne są warianty modeli PLLuM i Llama-PLLuM w formie kolorowych bloków, a na pierwszym planie siedzi publiczność.

– Mamy zasoby, plan i pomysły – mówił podczas rozpoczęcia spotkania podsumowującego projekt PLLuM Radosław Nielek, dyrektor NASK. – Nie jesteśmy w połowie drogi, nawet w jednej czwartej – jesteśmy na jej początku, a przed nami ogrom pracy. Będziemy dążyć w stronę horyzontu, który wyznaczają dynamicznie rozwijające się modele sztucznej inteligencji.

PLLuM to odpowiedź na konkretne zapotrzebowania.

– Administracja publiczna w Polsce potrzebuje automatyzacji i usprawnienia pracy. Projekty takie jak PLLuM to szansa na rozwój kompetencji nie tylko naukowców, ale i pracowników samorządowych. Polska nie może się zatrzymywać; musi stawiać na rozwiązania, które budują nowoczesne państwo – mówiła Aleksandra Tomaszewska, zastępczyni dyrektora Departamentu Badań i Innowacji w Ministerstwie Cyfryzacji.

Podsumowanie projektu HIVE AI

Wyniki prac konsorcjum zaprezentowali dr Agnieszka Karlińska, kierowniczka Zakładu Dużych Modeli Językowych w NASK i kierowniczka HIVE AI, oraz dr hab. Piotr Pęzik, prof. Uniwersytetu Łódzkiego, kierownik operacyjny.

W trakcie trwania projektu:

opublikowano 8 nowych modeli PLLuM, w tym 5 na licencjach w pełni otwartych;
udostępniono dwa autorskie zbiory danych do dostrajania i wychowania LLM-ów (ang. alignment) – PLLuMIC oraz PLLuM-Align – wraz ze szczegółowym opisem metodologii ich tworzenia;
przekazano do testów dwa prototypy inteligentnego asystenta obywatelskiego.

To jednak tylko część rezultatów. Kolejnych 11 modeli jest gotowych do publikacji. Będą to nowe odsłony sprawdzonych modeli PLLuM o rozmiarach 8, 12 i 70 miliardów parametrów, a także nowość w rodzinie – model o rozmiarze 4 miliardów parametrów.

– Mniejszy model stworzyliśmy z myślą o instytucjach z ograniczoną infrastrukturą obliczeniową. To efektywne narzędzie do konkretnych zadań, takich jak choćby klasyfikacja dokumentów – wyjaśniała dr Agnieszka Karlińska.

Premiera nowych modeli planowana jest na koniec stycznia. Udostępnione zostaną na szerokich licencjach, które pozwolą na zastosowania komercyjne. Kierownicy projektu zapowiedzieli również publikację kolejnych podzbiorów danych do dostrajania modeli oraz autorskiej aplikacji do anotacji instrukcji i preferencji. Już dziś odświeżone wersje PLLuM 12B-nc oraz PLLuM 8x7B-nc, a więc modeli opracowanych dla celów badawczych, są dostępne w aplikacji PLLuM Chat.

Nowe dane, nowe kompetencje

Nowe modele PLLuM trenowane były na rozszerzonych i zaktualizowanych zbiorach danych, dlatego lepiej radzą sobie z zadaniami.

– Pozyskaliśmy nowe korpusy do pretreningu, sięgając po nieoczywiste źródła, takie jak dokumenty wyodrębnione z załączników publikowanych na portalach rządowych i w Biuletynach Informacji Publicznej. Zakupiliśmy również wysokiej jakości dane prasowe od wydawców oraz zaktualizowaliśmy dotychczasowe źródła. Istotnym elementem prac była rygorystyczna weryfikacja licencji oraz zastrzeżeń związanych z eksploracją tekstów i danych (TDM), prowadzona w zgodzie z wymogami unijnego AI Act i polskiego prawa autorskiego. Równolegle pracowaliśmy nad nowymi danymi do posttreningu. Postawiliśmy na instrukcje i preferencje tworzone ręcznie według ścisłych wytycznych. Naszym celem było nauczenie modeli realizacji nowych zadań – przede wszystkim generatywnych – przy zachowaniu wysokiej poprawności językowej – wyjaśniała podczas spotkania dr Agnieszka Karlińska.

Nowe kompetencje modeli PLLuM obejmują przede wszystkim:

tworzenie tekstów prawniczych i urzędowych,
realizację zadań biurowo-administracyjnych,
upraszczanie języka.

Punktem wyjścia były potrzeby polskiej administracji, ale zespół rozwijający PLLuM patrzył szerzej. Modele trenowano także pod kątem tworzenia treści, rozumowania i pracy w scenariuszach opartych na mechanizmach RAG. Zakres tych zadań ustalono na podstawie analizy użycia aplikacji PLLuM Chat – od końca lutego 2025 roku użytkownicy zadali tam modelom ponad 1,6 mln pytań.

Modele od podstaw i współpraca z Mistral AI

Jednym z najbardziej ambitnych przedsięwzięć zrealizowanych w ramach projektu HIVE AI był trening modelu o rozmiarze 24 miliardów parametrów od wag losowych.

– Polskojęzyczne LLM-y powstawały dotychczas poprzez adaptację wielojęzycznych modeli fundamentalnych. To podejście skuteczne, ale ograniczające transparentność – tłumaczyła dr Karlińska. – Chcieliśmy sprawdzić, czy w polskich warunkach da się zbudować model od zera, wyłącznie na własnych danych. Wierzymy, że pomoże to lepiej zrozumieć, jak działają duże modele językowe.

W pełni transparentny model PLLuM, trenowany na około 850 miliardach tokenów w języku polskim i angielskim, zostanie udostępniony jeszcze w tym miesiącu.

Nieco później ukaże się model opracowany we współpracy z francuską firmą Mistral AI, zajmującą się tworzeniem otwartych, wielojęzycznych modeli językowych. Mimo formalnego zakończenia projektu HIVE AI trwają intensywne prace nad modelem o roboczej nazwie Polstral. Jest to adaptacja językowa modelu bazowego Mistral-Small-24B, przeprowadzona na stosunkowo dużej puli wysokiej jakości danych angielskich i polskich (ok. 700 miliardów tokenów), z których znaczną część dostarczył właśnie Mistral AI.

Prelegent z mikrofonem w ręku prezentuje wykresy na slajdzie. — dr hab. Piotr Pęzik, prof. Uniwersytetu Łódzkiego, kierownik operacyjny HIVE AI

– Co ważne, dzięki współpracy z zespołem inżynierów firmy Mistral AI dane te zostały dobrane w taki sposób, aby uniknąć tzw. problemu katastrofalnego zapominania wiedzy i umiejętności modeli w procesie dostrajania – mówił prof. Piotr Pęzik, kierownik operacyjny HIVE AI. – Spodziewamy się, że Polstral będzie równie dobry w zadaniach ogólnych jak modele instrukcyjne z serii Mistral-Small, a jednocześnie ponadprzeciętny w generowaniu szerokiego spektrum gatunków tekstów w języku polskim, w tym tekstów z domeny urzędowej. Osobiście jestem zwolennikiem celowanej adaptacji językowej – uważam, że modele niewielkich i średnich rozmiarów mogą być dobre w zadaniach generatywnych, w odróżnieniu od pasywnego rozumienia i przetwarzania treści, w maksymalnie kilku wybranych językach – dodaje.

W prace nad nowym modelem zaangażowani są eksperci z NASK, Uniwersytetu Łódzkiego, ACK Cyfronet oraz Politechniki Wrocławskiej.

Plany na przyszłość

W tym roku projekt PLLuM skoncentruje się na dwóch filarach: wdrożeniowym oraz badawczym. Priorytetem jest budowa aktywnego ekosystemu współpracy i społeczności, która pozwoli na realne wykorzystanie modeli w administracji publicznej (m.in. w aplikacji mObywatel) oraz samorządach.

– W planach badawczych kluczowe miejsce zajmuje stworzenie pierwszego polskiego komercyjnego modelu wizyjno-językowego oraz dalsza, rygorystyczna ewaluacja jakości danych – mówił Wojciech Kusa, kierownik Zakładu Inżynierii Lingwistycznej i Analizy Tekstu NASK. – Sukces tych rozwiązań zależy od ścisłej współpracy między nauką a sektorem publicznym, dlatego twórcy otwierają się na wspólne budowanie zbiorów danych i wymianę doświadczeń poprzez nową platformę współpracy.

Prelegent z mikrofonem w ręku na tle slajdu. — Wojciech Kusa, kierownik Zakładu Inżynierii Lingwistycznej i Analizy Tekstu NASK

Kolejnym elementem nadchodzących działań jest intensyfikacja wdrożeń w administracji publicznej, ze szczególnym uwzględnieniem aplikacji mObywatel. Planowany rozwój tego największego wdrożenia obejmuje nie tylko dodawanie nowych funkcjonalności czatbota, ale przede wszystkim podniesienie rygoru naukowego poprzez zaawansowane testy i ewaluację poprawności. Równolegle, bazując na sukcesach w Gdyni i Poznaniu, projekt otwiera się na współpracę z kolejnymi jednostkami samorządowymi.

Wdrożenia modeli PLLuM

W projekcie HIVE AI nauka od razu spotyka się z praktyką – badania od początku miały swój konkretny cel wdrożeniowy. Modele PLLuM zostały pilotażowo udostępnione w:

Ministerstwie Cyfryzacji w formie wewnętrznego asystenta;
w dwóch urzędach miejskich – Gdyni oraz Poznania;
aplikacji mObywatel jako wirtualny asystent, który rozwijany jest przez Centralny Ośrodek Informatyki.

W Gdyni dostrojona do potrzeb urzędu wersja modelu PLLuM zasiliła miejską wyszukiwarkę. Mieszkańcy mogą zadawać pytania w języku naturalnym, a system wskazuje odpowiednie dokumenty z Biuletynu Informacji Publicznej.

W Poznaniu modele PLLuM pomagają urzędnikom szybciej wyszukiwać informacje i sprawniej odpowiadać na pytania mieszkańców. Pilotażowe wdrożenie zrealizowano z użyciem aplikacji ShpaRAG, która wspiera szybkie prototypowanie i testowanie rozwiązań typu RAG. W trakcie pilotażu około 90% odpowiedzi asystenta okazało się w pełni poprawnych.

W aplikacji mObywatel modele PLLuM wspierają ponad 10 milionów użytkowników, pomagając znaleźć właściwe wnioski i formularze. Podpowiadają też jak załatwić formalności czy informują o możliwościach aplikacji.

Bądź częścią społeczności PLLuM! Zapisz się do newslettera tutaj, aby nie przegapić żadnych aktualności.

Tematy powiązane

Cyfryzacja HIVE AI Instytut Sztuczna inteligencja

Udostępnij ten post

Wyróżnione aktualności

Zobacz wszystko

Grafika przedstawiająca smutną dziewczynkę kadrowaną od nosa w dół, która stoi przodem do kamery, za ramiona trzyma ją od tyłu mężczyzna.

Aktualność

26 Maja 2026|8 min. czytania

Pedofilia w internecie kwitnie dzięki AI. Raport Dyżurnet.pl za 2025 rok

300 proc. rok do roku. O tyle wzrosła liczba materiałów wygenerowanych przez AI, które przedstawiają seksualne wykorzystanie dzieci. Znacząco rośnie udział komunikatorów internetowych w dystrybucji CSAM. O tym mówi raport roczny z działań Dyżurnet.pl - zespołu, który w ramach NASK przyjmuje i analizuje zgłoszenia związane z treściami nielegalnymi i szkodliwymi dla dzieci i młodzieży.

Cyberbezpieczeństwo Dyżurnet

Trzech mężczyzn stojących na scenie przed wizualizacją nowego budynku Centrum Cyberbezpieczeństwa NASK podczas oficjalnego wydarzenia.

Aktualność

22 Maja 2026|9 min. czytania

Centrum Cyberbezpieczeństwa NASK o krok bliżej

Ultranowoczesne Centrum Cyberbezpieczeństwa NASK powstanie na warszawskiej Pradze-Północ, a w nim m.in. laboratoria do rozwoju sztucznej inteligencji czy Centrum Odzyskiwania Danych. Instytut właśnie uzyskał decyzję o pozwoleniu na budowę CCN. To już tylko jeden krok od symbolicznego “wbicia łopaty” i – co za tym idzie – wzmocnienia krajowego systemu cyberbezpieczeństwa.

CCN Centrum Cyberbezpieczeństwa NASK Fundusze Europejskie

Aktualność

21 Maja 2026|7 min. czytania

Rodzina PLLuM znowu się powiększa. Polskie AI coraz silniejsze

Co łączy pismo z urzędu, firmową bazę wiedzy, pomocnika AI w banku i aplikację, która ma odpowiedzieć użytkownikowi prostym językiem?

HIVE AI Instytut Sztuczna inteligencja

Aktualność

14 Maja 2026|8 min. czytania

NASK na Impact’26. Technologia po właściwej stronie

– W tym roku przyjechaliśmy na Impact z wyjątkową agendą, bo zależało nam na tym, aby w atrakcyjny i angażujący sposób opowiedzieć o tym, czym zajmujemy się na co dzień. Za nami inspirujące debaty poświęcone twórcom i sztucznej inteligencji, cyberbezpieczeństwu oraz wyzwaniom, jakie niesie cyfrowy świat – podsumowywał obecność NASK na Impact’26 szef instytutu Radosław Nielek.

Cyberbezpieczeństwo Instytut Sztuczna inteligencja

Informacje

Najnowsze aktualności

Zobacz wszystko

Radosław Nielek, dyrektor NASK na Zlocie OSEhero.

Aktualność

03 Lipca 2026|6 min. czytania

Zlot OSEhero 2026: edukacja dla bezpieczeństwa w sieci

Osiem minut. Tyle wystarczyło, żeby zamknąć zapisy na tegoroczny Zlot OSEhero. Na chętnych czekało 150 miejsc. To rekordowe zainteresowanie najlepiej pokazuje, jak silną społeczność udało się zbudować wokół projektu NASK i jak wielu nauczycieli chce dziś uczyć o bezpieczeństwie w sieci w sposób praktyczny, aktualny i bliski doświadczeniom uczniów.

Cyberbezpieczeństwo Cyberprofilaktyka OSE

Aktualność

02 Lipca 2026|4 min. czytania

NASK z przełomowym narzędziem od OpenAI

Mają go tylko dwa kraje w Europie. Dzięki NASK do tego elitarnego grona dołącza Polska. Instytut zyskuje dostęp do GPT-5.5 Cyber – innowacyjnego modelu sztucznej inteligencji stworzonego przez OpenAI z myślą o wykrywaniu i analizie cyberzagrożeń. To przełom dla polskiego cyberbezpieczeństwa i olbrzymie możliwości dla CERT Polska – zespołu, działającego w ramach NASK.

CERT Polska Cyberbezpieczeństwo Innowacje

Grafika-Aktualności-Zanim-zaplanujesz-urlop-pamietak-o-odnowieniu-domeny-pl-4x3

Aktualność

01 Lipca 2026|5 min. czytania

Rekordowa – domena .pl. Najlepszy wynik od 2019 roku

Już pierwsze półrocze 2026 pokazuje, że NASK idzie na rekord nowych rejestracji w domenie .pl. W czerwcu było to ponad 70 tys., czyli aż jedną trzecią więcej niż w ubiegłym roku. To najlepszy wynik od 2019 roku. Polacy ufają domenie pl, której rejestr prowadzi NASK. Rosnące liczby są tego najlepszym dowodem.

Domena .pl