Ministerstwo Cyfryzacji zaprezentowało dostępny od dzisiaj polski model językowy pod nazwą PLLuM. Polish Large Language Model to rodzina modeli sztucznej inteligencji (ang. AI, Artificial Intelligence), pozwalające przetwarzać i generować teksty w języku polskim. Zostały one opracowane przez polskich ekspertów IT i lingwistyki, w celu wspierania rozwoju kompetencji cyfrowych oraz innowacji w administracji publicznej i biznesie.
„PLLuM to dowód na to, że możemy rozwijać nowoczesne technologie na własnych warunkach, w naszym języku, z korzyścią dla obywatelek i obywateli. Tworzymy fundament pod inteligentne usługi publiczne i innowacje, które będą realnym wsparciem zarówno dla administracji, jak i biznesu.” – mówi Wicepremier i Minister Cyfryzacji Krzysztof Gawkowski.
Projekt, na zlecenie Ministerstwa Cyfryzacji, które jest właścicielem wyników i kontroluje rozwój PLLuM, realizowany był przez konsorcjum sześciu podmiotów: Politechnika Wrocławska (lider projektu), Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN, Naukowa i Akademicka Sieć Komputerowa (NASK-PIB), Ośrodek Przetwarzania Informacji (OPI-PIB), Uniwersytet Łódzki. W 2025 roku dołączy Centralny Ośrodek Informatyki oraz Akademickie Centrum Komputerowe CYFRONET AGH.
Główne zalety polskiego modelu językowego to:
elastyczność i skalowalność – model wykorzystuje od 8 do 70 miliardów parametrów, pozwalających precyzyjnie generować treści w języku polskim. *) W rodzinie modeli PLLuM znajdują się m.in. modele w architekturze MoE (ang. Mixture of Experts) ze zrównoważonym wyborem ekspertów oraz wyspecjalizowane modele RAG (ang. Retrieval Augmented Generation).
bazowanie na etycznym pozyskiwaniu danych – wersje komercyjne wykorzystują zasoby tekstowe właścicieli, którzy udzielili licencji konsorcjum twórców, a także zasoby, które mogą być wykorzystywane do budowy w pełni otwartego modelu, zgodnie z ustawą o prawie autorskim i prawach pokrewnych oraz przepisami UE, jak również modeli naukowych (m.in. Common Crawl).
możliwość dostrajania modelu na autorskich zbiorach danych i dziesiątkach tysięcy instrukcji (prompty oraz oczekiwane odpowiedzi modelu) oraz preferencji (prompty i różne odpowiedzi oceniane pod kątem jakościowym przez zespół ekspertów).
budowanie ekosystemu polskich modeli językowych – razem z modelem Bielik będzie promowana sztuczna inteligencja tworzona w Polsce tak, aby #AIMadeInPoland była coraz lepsza i znajdowała szerokie zastosowanie w administracji publicznej, biznesowe oraz społeczne.
PLLuM jest dostosowany do specyfiki języka polskiego oraz terminologii używanej administracji publicznej, korzysta z danych organicznych (opracowywanych ręcznie, a nie przy użyciu innych modeli językowych) oraz trenowany na polskich zasobach, więc bardzo dobrze radzi sobie z wyzwaniami fleksji i złożonej składni, generując poprawnie treści w języku polskim.
Dotychczas na projekt wydanych zostało 14,5 mln zł, a kolejne 19 mln zł pozwoli na wdrożenie modelu w administracji publicznej i rozszerzenie współpracy o nowych partnerów. Lider konsorcjum HIVE – Ośrodek Badań nad Bezpieczeństwem SI w NASK – będzie koordynować prace wdrożeniowe PLLuM w usługach administracji publicznej.
PLLuM m.in. dostarczy zaawansowane rozwiązania dla administracji publicznej i tym samym wesprze dalszą cyfryzację Polski:
Wirtualny asystent w aplikacji mObywatel wesprze obywateli w uzyskiwaniu informacji publicznych.
Inteligentny asystent urzędniczy zautomatyzuje przetwarzanie dokumentów, analizę treści, wyszukiwanie informacji i wsparcie w udzielaniu odpowiedzi na pytania obywateli.
Ułatwi także rozwój aplikacji edukacyjnych, tłumaczeń i pomoc nauczycielom w prowadzeniu angażujących lekcji z użyciem najnowszych technologii.
Rozwój projektu umożliwi jeszcze szersze zastosowanie AI w życiu codziennym. Polska ma szansę stać się jednym z liderów w rozwoju modeli językowych, co niewątpliwie może przełożyć się na wzrost innowacyjności i konkurencyjności całej gospodarki, a także rozwój edukacji. [MI]
PLLuM jest dostępny na stronie: http://pllum.clarin-pl.eu
Modele można pobrać na stronie: https://router.huggingface.co/CYFRAGOVPL
*) UWAGA: Ten artykuł został napisany przez człowieka bez użycia sztucznej inteligencji, na podstawie informacji prasowej przekazanej przez Ministerstwo Cyfryzacji.









