Unia Europejska
Typ_aktualnosc Aktualność
21 Maja 2026|7 min. czytania

Rodzina PLLuM znowu się powiększa. Polskie AI coraz silniejsze

Co łączy pismo z urzędu, firmową bazę wiedzy, pomocnika AI w banku i aplikację, która ma odpowiedzieć użytkownikowi prostym językiem?

Szymon Łukasik
Łuna gradientu wychodząca od dołu

Właśnie z myślą o takich zastosowaniach rozwijany jest PLLuM – polska rodzina modeli językowych tworzona przez konsorcjum HIVE AI, którego liderem jest NASK. Do użytkowników trafia teraz 11 nowych modeli: od lekkich wariantów do prostszych zadań, po największy model 70B przeznaczony do bardziej wymagającej pracy z tekstem. To kolejny krok w budowie narzędzi AI, które można dopasować do realnych potrzeb administracji, biznesu i usług cyfrowych.

Nowe modele są dostępne otwarcie i bezpłatnie. Nie trzeba prosić o zgodę na ich pobranie ani raportować, gdzie zostały wdrożone. Takie podejście przyspiesza testowanie i rozwój zastosowań w różnych sektorach.

– Nowe modele można pobrać i wykorzystywać. Jest to całkowicie bezpłatne, otwarte dla każdego. Zapraszamy do testowania, komentowania i wskazywania, co jeszcze możemy poprawić, bo to też jest zawsze bardzo ważna informacja. Róbmy to wspólnie – podkreślał wiceminister cyfryzacji Dariusz Standerski.

– Chcemy, żeby PLLuM był coraz lepszy i znajdował zastosowanie w kolejnych miejscach. Już dziś korzystają z niego samorządy i instytucje, nie tylko państwowe. Cały czas się rozwijamy i tworzymy nowe modele. Przedstawiamy kolejny etap udostępniania rozwiązań generatywnej sztucznej inteligencji wytworzonych tu, w Polsce. Robimy to z poszanowaniem praw autorskich i jako jedni z pierwszych zgodnie z wytycznymi AI Act. To wynik prac prowadzonych w ramach konsorcjum. Zbudowaliśmy nie tylko modele językowe, ale i unikalne kompetencje w polskim ekosystemie AI – mówi dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK Szymon Łukasik.

PLLuM, czyli polski język w centrum technologii

PLLuM to polska rodzina modeli językowych, która ma wspierać pracę z tekstem, wiedzą i dokumentami. Może pomagać tam, gdzie człowiek na co dzień mierzy się z dużą liczbą informacji: przy wyszukiwaniu odpowiedzi w procedurach, streszczaniu treści, porządkowaniu dokumentów, przygotowywaniu projektów pism albo upraszczaniu języka, który zbyt często brzmi bardziej jak załącznik do decyzji niż komunikat dla człowieka.

Modele rozwijano z myślą o polszczyźnie w jej różnych odmianach. Nie tylko tej codziennej, znanej z rozmów czy internetu, ale też tej trudniejszej: urzędowej, prawnej, technicznej i instytucjonalnej. Właśnie tam precyzja ma największe znaczenie. Jedno źle rozumiane pojęcie, zbyt ogólna odpowiedź albo brak znajomości kontekstu mogą sprawić, że narzędzie AI będzie efektowne, ale mało użyteczne.

Nowe modele uczono na około 7 milionach polskojęzycznych tekstów. W zbiorze znalazły się m.in. akty prawne, stenogramy parlamentarne, zasoby domeny publicznej, materiały licencjonowane i treści dostępne na otwartych licencjach. Dane były sprawdzane pod kątem jakości, legalności wykorzystania i bezpieczeństwa. Osobną częścią prac było przygotowanie instrukcji, czyli par pytań i wzorcowych odpowiedzi, które pozwalają modelowi lepiej wykonywać konkretne zadania.

– Naszym bardzo wyraźnym punktem koncentracji była oczywiście zdolność modeli do porozumiewania się z użytkownikiem w języku polskim. Ta dbałość wiąże się z tym, że poza pozyskiwaniem danych ze źródeł transparentnych, co do których mamy pewność, że jesteśmy w stanie z nich korzystać, wytwarzamy również własne instrukcje, czyli pary pytanie–odpowiedź, tworzone w dużym stopniu manualnie przez analityków. Dzięki temu jesteśmy w stanie uzyskać tę kompetencję językową, której oczekujemy od modelu języka polskiego – mówił Szymon Łukasik z NASK.

Tak przygotowany PLLuM może być wykorzystywany w różnych typach rozwiązań. W administracji może wspierać pracę z pismami, procedurami i pytaniami obywateli. W biznesie – pomagać w przeszukiwaniu wewnętrznych regulacji, instrukcji czy baz wiedzy. W usługach cyfrowych – ułatwiać tworzenie systemów, które odpowiadają użytkownikom w bardziej zrozumiały sposób.

– Już od miesięcy nasz model jest wykorzystywany przez większość obywateli, nawet jeśli nie zawsze zdają sobie z tego sprawę. Każdy, kto ma aplikację mObywatel, korzysta już z tego, co oferuje polski model językowy PLLuM. A za kilka tygodni ruszamy również z wykorzystywaniem sztucznej inteligencji w pracach administracji publicznej, czyli z pierwszymi wdrożeniami w pracy urzędniczej w Ministerstwie Cyfryzacji oraz w Kancelarii Prezesa Rady Ministrów – podkreślił Szymon Łukasik.

Mały do prostych zadań, większy do trudniejszych

Nowa rodzina PLLuM obejmuje modele 4B, 8B, 12B i 70B. Litera „B” oznacza miliardy parametrów. Parametry można najprościej opisać jako elementy, dzięki którym model rozpoznaje zależności w języku i uczy się odpowiadać na polecenia. Większy model ma większe możliwości, ale potrzebuje też większej mocy obliczeniowej.

Wybór modelu zależy od zadania. Jeśli system ma wykonywać prostsze, powtarzalne czynności, nie zawsze potrzebuje największego wariantu. Z kolei jeśli ma analizować długie dokumenty, prowadzić bardziej złożoną rozmowę albo pracować z wieloma wątkami jednocześnie, większy model może sprawdzić się lepiej – w przypadku rodziny PLLuM byłby to model 70B.

Najlżejszą kategorią są modele 4B. To nowość w rodzinie PLLuM, przygotowana z myślą o środowiskach, w których liczy się szybkość działania i niższe wymagania sprzętowe. Mogą sprawdzać się przy jasno określonych zadaniach: wstępnym porządkowaniu dokumentów, prostszym wsparciu formularzy, klasyfikowaniu zgłoszeń albo jako element lokalnego systemu, który nie powinien wymagać bardzo rozbudowanej infrastruktury.

Modele 8B i 12B dają więcej możliwości, ale nadal pozostają stosunkowo lekkie. To dobry wybór dla wielu wdrożeń produkcyjnych, zwłaszcza tam, gdzie model ma współpracować z bazą dokumentów. Może pomagać w systemach, które odpowiadają na pytania na podstawie regulaminów, procedur, instrukcji albo wewnętrznych materiałów instytucji.

3 warianty nowych modeli

Modele są udostępnione w trzech wariantach: bazowym, instrukcyjnym oraz dialogowym.

– Wersja bazowa jest przeznaczona dla tych, którzy chcą dalej dostrajać model na własnych instrukcjach. Wersja instrukcyjna została już przygotowana do wykonywania konkretnych poleceń, w szczególności instrukcjach o charakterze urzędowym. Ostatnia kategoria to modele dialogowe, modele czat, które dodatkowo zostały wychowane. To wyraz naszej troski o to, by modele, poza transparentnością i zgodnością z aktami prawnymi, były również bezpieczne pod kątem używania przez użytkowników końcowych – wyjaśnił Szymon Łukasik.

Otwarte modele dla każdego

W administracji i sektorach regulowanych samo działanie modelu nie wystarcza. Ważne jest również to, czy można sprawdzić, jak powstał, na jakich danych był trenowany i jakie ma ograniczenia. Przy usługach publicznych przejrzystość staje się częścią bezpieczeństwa.

Wszystkie nowe modele PLLuM udostępniono na otwartych licencjach oraz z dokumentacją zgodną z wymaganiami AI Act. Dokumentacja opisuje m.in. źródła danych, sposoby ich przetwarzania, metody treningowe i ewaluacyjne. Podczas konferencji podkreślano, że to rozwiązanie wyróżnia polski projekt także na tle innych państw Unii Europejskiej.

– To unikalne rozwiązanie, ponieważ w państwie Unii Europejskiej to dalej jest nowość: są to pierwsze modele krajowe udostępniane przez administrację centralną z dokumentacją w pełnej zgodności z aktem o sztucznej inteligencji – mówił Dariusz Standerski, Sekretarz stanu w ministerstwie cyfryzacji.

Dla instytucji oznacza to większą kontrolę nad technologią. Można zobaczyć, z jakiego typu danych korzystano, jak oceniano model i gdzie przebiegają jego granice. To szczególnie ważne tam, gdzie AI ma wspierać pracę z dokumentami, obsługę obywateli albo procesy wymagające zaufania.

Nowe modele powstały w projekcie HIVE AI realizowanym w 2025 roku przez konsorcjum, w którego skład wchodzą: NASK jako lider, ACK Cyfronet AGH, Centralny Ośrodek Informatyki, Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN, OPI PIB, Politechnika Wrocławska i Uniwersytet Łódzki. Kierowniczką projektu była dr Agnieszka Karlińska, a kierownikiem operacyjnym dr hab. prof. UŁ Piotr Pęzik.

Wszystkich zainteresowanych rozwojem polskiej rodziny modeli językowych PLLuM zapraszamy do dołączenia do społeczności PLLuM na Discordzie.

Udostępnij ten post

Wyróżnione aktualności

Paweł Kostkiewicz
Typ_aktualnosc Aktualność
02 Kwietnia 2026|7 min. czytania

Razem dla bezpieczeństwa sieci 5G – warsztaty 5G TACTIC w NASK

5G ma napędzać transport, przemysł, administrację, a za chwilę – rzeczy, których jeszcze nawet nie nazywamy. Problem w tym, że im więcej od tej technologii zależy, tym mniej miejsca zostaje na pomyłki.

Grafika z kołami mającymi symbolizować nowoczesne przesyłanie informacji.
Typ_aktualnosc Aktualność
27 Marca 2026|4 min. czytania

Transgraniczna autostrada danych. Ruszył projekt QKD Germany‑Poland‑Czechia

Czy istnieje rozmowa, której nie da się podsłuchać albo informacje, których nie da się przechwycić? W niedalekiej przyszłości powstanie pierwsza tak rozbudowana sieć kwantowa w Europie Środkowej, która wykorzysta technologię generowania i dystrybucji kluczy kryptograficznych. To oznacza bezpieczne przesyłanie informacji międzynarodowych. NASK jest partnerem tej inicjatywy.

Dyrektor i Minister oglądają komputer
Typ_aktualnosc Aktualność
23 Marca 2026|7 min. czytania

Moc obliczeniowa dla polskiej AI. Pierwszy superkomputer NASK wystartował

NASK uruchomił nowy klaster do obliczeń AI. Wart 30 milionów złotych projekt to inwestycja w zdolność prowadzenia badań, tworzenia własnych narzędzi i rozwijania technologii, które odpowiadają na konkretne potrzeby państwa i obywateli.

Trzech mężczyzn w garniturach ściska dłonie podczas wydarzenia z okazji 30-lecia CERT Polska; w tle widoczna grafika z napisem „30 lat CERT Polska” oraz logotypy NASK i Ministerstwa Cyfryzacji.
Typ_aktualnosc Aktualność
11 Marca 2026|8 min. czytania

Cyberbezpiecznie od 30 lat. CERT Polska

Od 12 incydentów w 1996 roku, po przeszło 260 tysięcy w ubiegłym. Te liczby najlepiej pokazują, jak diametralnie zmieniła się skala cyberataków oraz rola CERT Polska w podnoszeniu świadomości o cyberbezpieczeństwie. Pierwszy w Polsce zespół reagowania na zagrożenia w sieci, który powstał w NASK, obchodzi właśnie 30 urodziny.

Informacje

Najnowsze aktualności

KCM
Typ_aktualnosc Aktualność
20 Maja 2026|9 min. czytania

Wakacje 2026 z Klubem Cyfrowych Możliwości – rekrutacja trwa!

Wakacje zbliżają się szybciej, niż się wydaje, a rodzice zadają sobie pytanie, co zrobić, żeby dzieci połączyły przyjemne z pożytecznym? Odpowiedzią może być Klub Cyfrowych Możliwości. Właśnie ruszyły zapisy na bezpłatne warsztaty KCM, które tego lata pojawią się w 54 miejscowościach. To cztery dni zajęć, podczas których dzieci nie tylko „korzystają z technologii”, ale zaczynają ją rozumieć i tworzyć po swojemu.

CCN_KONFERENCJA_4x3_3
Typ_aktualnosc Aktualność
20 Maja 2026|5 min. czytania

CCN. Nowy wymiar ochrony w cyfrowym świecie

Polska zyskuje prawdziwą tarczę w cyberprzestrzeni. Centrum Cyberbezpieczeństwa NASK (CCN), które powstaje w Warszawie, to odpowiedź na aktualne wyzwania i potrzeby związane z szybko rosnącą liczbą zagrożeń w świecie wirtualnym. Budynek CCN to m.in. nowe laboratoria, w których eksperci NASK będą udoskonalać wykrywanie złośliwego oprogramowania, pracować nad rozwojem sztucznej inteligencji i jeszcze lepszym zabezpieczaniem naszych danych.

Grafika-Aktualnosci-Wzmacnianie-bezpieczenstwa-cyfrowego
Typ_aktualnosc Aktualność
19 Maja 2026|7 min. czytania

60 mln zł na cyberbezpieczeństwo MŚP. NASK i PARP wzmacniają cyfrową odporność firm

60 mln zł pomoże małym i średnim firmom wzmocnić to, co w cyberbezpieczeństwie jest dziś jednym z najważniejszych elementów: świadomość pracowników. Bo atak nie zawsze zaczyna się od włamania do systemu. Czasem jest to fałszywy mail z fakturą, telefon od „kontrahenta”, kliknięcie w link albo przelew zrobiony pod presją czasu.