21 Maja 2026|7 min. czytania

Rodzina PLLuM znowu się powiększa. Polskie AI coraz silniejsze

Co łączy pismo z urzędu, firmową bazę wiedzy, pomocnika AI w banku i aplikację, która ma odpowiedzieć użytkownikowi prostym językiem?

HIVE AI Instytut Sztuczna inteligencja

Właśnie z myślą o takich zastosowaniach rozwijany jest PLLuM – polska rodzina modeli językowych tworzona przez konsorcjum HIVE AI, którego liderem jest NASK. Do użytkowników trafia teraz 11 nowych modeli: od lekkich wariantów do prostszych zadań, po największy model 70B przeznaczony do bardziej wymagającej pracy z tekstem. To kolejny krok w budowie narzędzi AI, które można dopasować do realnych potrzeb administracji, biznesu i usług cyfrowych.

Nowe modele są dostępne otwarcie i bezpłatnie. Nie trzeba prosić o zgodę na ich pobranie ani raportować, gdzie zostały wdrożone. Takie podejście przyspiesza testowanie i rozwój zastosowań w różnych sektorach.

– Nowe modele można pobrać i wykorzystywać. Jest to całkowicie bezpłatne, otwarte dla każdego. Zapraszamy do testowania, komentowania i wskazywania, co jeszcze możemy poprawić, bo to też jest zawsze bardzo ważna informacja. Róbmy to wspólnie – podkreślał wiceminister cyfryzacji Dariusz Standerski.

– Chcemy, żeby PLLuM był coraz lepszy i znajdował zastosowanie w kolejnych miejscach. Już dziś korzystają z niego samorządy i instytucje, nie tylko państwowe. Cały czas się rozwijamy i tworzymy nowe modele. Przedstawiamy kolejny etap udostępniania rozwiązań generatywnej sztucznej inteligencji wytworzonych tu, w Polsce. Robimy to z poszanowaniem praw autorskich i jako jedni z pierwszych zgodnie z wytycznymi AI Act. To wynik prac prowadzonych w ramach konsorcjum. Zbudowaliśmy nie tylko modele językowe, ale i unikalne kompetencje w polskim ekosystemie AI – mówi dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK Szymon Łukasik.

PLLuM, czyli polski język w centrum technologii

PLLuM to polska rodzina modeli językowych, która ma wspierać pracę z tekstem, wiedzą i dokumentami. Może pomagać tam, gdzie człowiek na co dzień mierzy się z dużą liczbą informacji: przy wyszukiwaniu odpowiedzi w procedurach, streszczaniu treści, porządkowaniu dokumentów, przygotowywaniu projektów pism albo upraszczaniu języka, który zbyt często brzmi bardziej jak załącznik do decyzji niż komunikat dla człowieka.

Modele rozwijano z myślą o polszczyźnie w jej różnych odmianach. Nie tylko tej codziennej, znanej z rozmów czy internetu, ale też tej trudniejszej: urzędowej, prawnej, technicznej i instytucjonalnej. Właśnie tam precyzja ma największe znaczenie. Jedno źle rozumiane pojęcie, zbyt ogólna odpowiedź albo brak znajomości kontekstu mogą sprawić, że narzędzie AI będzie efektowne, ale mało użyteczne.

Nowe modele uczono na około 7 milionach polskojęzycznych tekstów. W zbiorze znalazły się m.in. akty prawne, stenogramy parlamentarne, zasoby domeny publicznej, materiały licencjonowane i treści dostępne na otwartych licencjach. Dane były sprawdzane pod kątem jakości, legalności wykorzystania i bezpieczeństwa. Osobną częścią prac było przygotowanie instrukcji, czyli par pytań i wzorcowych odpowiedzi, które pozwalają modelowi lepiej wykonywać konkretne zadania.

– Naszym bardzo wyraźnym punktem koncentracji była oczywiście zdolność modeli do porozumiewania się z użytkownikiem w języku polskim. Ta dbałość wiąże się z tym, że poza pozyskiwaniem danych ze źródeł transparentnych, co do których mamy pewność, że jesteśmy w stanie z nich korzystać, wytwarzamy również własne instrukcje, czyli pary pytanie–odpowiedź, tworzone w dużym stopniu manualnie przez analityków. Dzięki temu jesteśmy w stanie uzyskać tę kompetencję językową, której oczekujemy od modelu języka polskiego – mówił Szymon Łukasik z NASK.

Tak przygotowany PLLuM może być wykorzystywany w różnych typach rozwiązań. W administracji może wspierać pracę z pismami, procedurami i pytaniami obywateli. W biznesie – pomagać w przeszukiwaniu wewnętrznych regulacji, instrukcji czy baz wiedzy. W usługach cyfrowych – ułatwiać tworzenie systemów, które odpowiadają użytkownikom w bardziej zrozumiały sposób.

– Już od miesięcy nasz model jest wykorzystywany przez większość obywateli, nawet jeśli nie zawsze zdają sobie z tego sprawę. Każdy, kto ma aplikację mObywatel, korzysta już z tego, co oferuje polski model językowy PLLuM. A za kilka tygodni ruszamy również z wykorzystywaniem sztucznej inteligencji w pracach administracji publicznej, czyli z pierwszymi wdrożeniami w pracy urzędniczej w Ministerstwie Cyfryzacji oraz w Kancelarii Prezesa Rady Ministrów – podkreślił Szymon Łukasik.

Mały do prostych zadań, większy do trudniejszych

Nowa rodzina PLLuM obejmuje modele 4B, 8B, 12B i 70B. Litera „B” oznacza miliardy parametrów. Parametry można najprościej opisać jako elementy, dzięki którym model rozpoznaje zależności w języku i uczy się odpowiadać na polecenia. Większy model ma większe możliwości, ale potrzebuje też większej mocy obliczeniowej.

Wybór modelu zależy od zadania. Jeśli system ma wykonywać prostsze, powtarzalne czynności, nie zawsze potrzebuje największego wariantu. Z kolei jeśli ma analizować długie dokumenty, prowadzić bardziej złożoną rozmowę albo pracować z wieloma wątkami jednocześnie, większy model może sprawdzić się lepiej – w przypadku rodziny PLLuM byłby to model 70B.

Najlżejszą kategorią są modele 4B. To nowość w rodzinie PLLuM, przygotowana z myślą o środowiskach, w których liczy się szybkość działania i niższe wymagania sprzętowe. Mogą sprawdzać się przy jasno określonych zadaniach: wstępnym porządkowaniu dokumentów, prostszym wsparciu formularzy, klasyfikowaniu zgłoszeń albo jako element lokalnego systemu, który nie powinien wymagać bardzo rozbudowanej infrastruktury.

Modele 8B i 12B dają więcej możliwości, ale nadal pozostają stosunkowo lekkie. To dobry wybór dla wielu wdrożeń produkcyjnych, zwłaszcza tam, gdzie model ma współpracować z bazą dokumentów. Może pomagać w systemach, które odpowiadają na pytania na podstawie regulaminów, procedur, instrukcji albo wewnętrznych materiałów instytucji.

3 warianty nowych modeli

Modele są udostępnione w trzech wariantach: bazowym, instrukcyjnym oraz dialogowym.

– Wersja bazowa jest przeznaczona dla tych, którzy chcą dalej dostrajać model na własnych instrukcjach. Wersja instrukcyjna została już przygotowana do wykonywania konkretnych poleceń, w szczególności instrukcjach o charakterze urzędowym. Ostatnia kategoria to modele dialogowe, modele czat, które dodatkowo zostały wychowane. To wyraz naszej troski o to, by modele, poza transparentnością i zgodnością z aktami prawnymi, były również bezpieczne pod kątem używania przez użytkowników końcowych – wyjaśnił Szymon Łukasik.

Otwarte modele dla każdego

W administracji i sektorach regulowanych samo działanie modelu nie wystarcza. Ważne jest również to, czy można sprawdzić, jak powstał, na jakich danych był trenowany i jakie ma ograniczenia. Przy usługach publicznych przejrzystość staje się częścią bezpieczeństwa.

Wszystkie nowe modele PLLuM udostępniono na otwartych licencjach oraz z dokumentacją zgodną z wymaganiami AI Act. Dokumentacja opisuje m.in. źródła danych, sposoby ich przetwarzania, metody treningowe i ewaluacyjne. Podczas konferencji podkreślano, że to rozwiązanie wyróżnia polski projekt także na tle innych państw Unii Europejskiej.

– To unikalne rozwiązanie, ponieważ w państwie Unii Europejskiej to dalej jest nowość: są to pierwsze modele krajowe udostępniane przez administrację centralną z dokumentacją w pełnej zgodności z aktem o sztucznej inteligencji – mówił Dariusz Standerski, Sekretarz stanu w ministerstwie cyfryzacji.

Dla instytucji oznacza to większą kontrolę nad technologią. Można zobaczyć, z jakiego typu danych korzystano, jak oceniano model i gdzie przebiegają jego granice. To szczególnie ważne tam, gdzie AI ma wspierać pracę z dokumentami, obsługę obywateli albo procesy wymagające zaufania.

Nowe modele powstały w projekcie HIVE AI realizowanym w 2025 roku przez konsorcjum, w którego skład wchodzą: NASK jako lider, ACK Cyfronet AGH, Centralny Ośrodek Informatyki, Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN, OPI PIB, Politechnika Wrocławska i Uniwersytet Łódzki. Kierowniczką projektu była dr Agnieszka Karlińska, a kierownikiem operacyjnym dr hab. prof. UŁ Piotr Pęzik.

Wszystkich zainteresowanych rozwojem polskiej rodziny modeli językowych PLLuM zapraszamy do dołączenia do społeczności PLLuM na Discordzie.

Tematy powiązane

HIVE AI Instytut Sztuczna inteligencja

Udostępnij ten post

Wyróżnione aktualności

Zobacz wszystko

Grafika przedstawiająca smutną dziewczynkę kadrowaną od nosa w dół, która stoi przodem do kamery, za ramiona trzyma ją od tyłu mężczyzna.

Aktualność

26 Maja 2026|8 min. czytania

Pedofilia w internecie kwitnie dzięki AI. Raport Dyżurnet.pl za 2025 rok

300 proc. rok do roku. O tyle wzrosła liczba materiałów wygenerowanych przez AI, które przedstawiają seksualne wykorzystanie dzieci. Znacząco rośnie udział komunikatorów internetowych w dystrybucji CSAM. O tym mówi raport roczny z działań Dyżurnet.pl - zespołu, który w ramach NASK przyjmuje i analizuje zgłoszenia związane z treściami nielegalnymi i szkodliwymi dla dzieci i młodzieży.

Cyberbezpieczeństwo Dyżurnet

Trzech mężczyzn stojących na scenie przed wizualizacją nowego budynku Centrum Cyberbezpieczeństwa NASK podczas oficjalnego wydarzenia.

Aktualność

22 Maja 2026|9 min. czytania

Centrum Cyberbezpieczeństwa NASK o krok bliżej

Ultranowoczesne Centrum Cyberbezpieczeństwa NASK powstanie na warszawskiej Pradze-Północ, a w nim m.in. laboratoria do rozwoju sztucznej inteligencji czy Centrum Odzyskiwania Danych. Instytut właśnie uzyskał decyzję o pozwoleniu na budowę CCN. To już tylko jeden krok od symbolicznego “wbicia łopaty” i – co za tym idzie – wzmocnienia krajowego systemu cyberbezpieczeństwa.

CCN Centrum Cyberbezpieczeństwa NASK Fundusze Europejskie

Aktualność

14 Maja 2026|8 min. czytania

NASK na Impact’26. Technologia po właściwej stronie

– W tym roku przyjechaliśmy na Impact z wyjątkową agendą, bo zależało nam na tym, aby w atrakcyjny i angażujący sposób opowiedzieć o tym, czym zajmujemy się na co dzień. Za nami inspirujące debaty poświęcone twórcom i sztucznej inteligencji, cyberbezpieczeństwu oraz wyzwaniom, jakie niesie cyfrowy świat – podsumowywał obecność NASK na Impact’26 szef instytutu Radosław Nielek.

Cyberbezpieczeństwo Instytut Sztuczna inteligencja

Informacje

Najnowsze aktualności

Zobacz wszystko

Radosław Nielek, dyrektor NASK na Zlocie OSEhero.

Aktualność

03 Lipca 2026|6 min. czytania

Zlot OSEhero 2026: edukacja dla bezpieczeństwa w sieci

Osiem minut. Tyle wystarczyło, żeby zamknąć zapisy na tegoroczny Zlot OSEhero. Na chętnych czekało 150 miejsc. To rekordowe zainteresowanie najlepiej pokazuje, jak silną społeczność udało się zbudować wokół projektu NASK i jak wielu nauczycieli chce dziś uczyć o bezpieczeństwie w sieci w sposób praktyczny, aktualny i bliski doświadczeniom uczniów.

Cyberbezpieczeństwo Cyberprofilaktyka OSE

Aktualność

02 Lipca 2026|4 min. czytania

NASK z przełomowym narzędziem od OpenAI

Mają go tylko dwa kraje w Europie. Dzięki NASK do tego elitarnego grona dołącza Polska. Instytut zyskuje dostęp do GPT-5.5 Cyber – innowacyjnego modelu sztucznej inteligencji stworzonego przez OpenAI z myślą o wykrywaniu i analizie cyberzagrożeń. To przełom dla polskiego cyberbezpieczeństwa i olbrzymie możliwości dla CERT Polska – zespołu, działającego w ramach NASK.

CERT Polska Cyberbezpieczeństwo Innowacje

Grafika-Aktualności-Zanim-zaplanujesz-urlop-pamietak-o-odnowieniu-domeny-pl-4x3

Aktualność

01 Lipca 2026|5 min. czytania

Rekordowa – domena .pl. Najlepszy wynik od 2019 roku

Już pierwsze półrocze 2026 pokazuje, że NASK idzie na rekord nowych rejestracji w domenie .pl. W czerwcu było to ponad 70 tys., czyli aż jedną trzecią więcej niż w ubiegłym roku. To najlepszy wynik od 2019 roku. Polacy ufają domenie pl, której rejestr prowadzi NASK. Rosnące liczby są tego najlepszym dowodem.

Domena .pl