JavaScript jest wyłączony

„Kontrabanda” została zaprojektowana, żeby możliwie największa część strony działała bez potrzeby uruchamiania JavaScriptu. Jednak niektóre funkcje jego wymagają. Oto lista funkcji, która nie zadziała bez włączenia obsługi JavaScriptu w tym miejscu:

Możliwość skopiowania linku do schowka
Publikacja własnych komentarzy i oddawanie głosów na istniejące

Sprawdziłem model językowy PLLuM. O Fediwersum trochę wie, o Kontrabandzie nie wie, a mnie myli z TikTokerem

2/25/2025

Oliwier Jaszczyszyn

Wpis pochodzi z wydania 02/2025

Sprawdziłem model językowy PLLuM. O Fediwersum trochę wie, o Kontrabandzie nie wie, a mnie myli z TikTokerem

Uwaga: w tym artykule pewna część zacytowanych informacji podanych przez PLLuM jest nieprawdziwa. Pamiętajcie o weryfikacji generowanych odpowiedzi przez dowolny model sztucznej inteligencji!

Informacja o modelu PLLuM pojawiła się na stronie internetowej Ministerstwa Cyfryzacji 24 lutego 2025 roku. Ministerstwo podaje, że model ten jest skalowalny (wykorzystuje od 8 do 70 miliardów parametrów), został zbudowany w oparciu o „etycznie pozyskane dane” (zakładam, że dzieje się to poprzez dedykowany formularz kontaktowy), dostrajany na „autorskich zbiorach danych”, aż w końcu przyczynia się do rozwoju polskiej sceny modeli sztucznej inteligencji. Prace nad nim nadzorował polski organ państwowy (Ministerstwo Cyfryzacji), a był on realizowany przez sześć instytucji również z siedzibą w Polsce – z Politechniką Wrocławską na czele.

Koszty przeznaczone na zbudowanie takiego modelu na dzień publikacji artykułu na stronie ministerstwa to 14,5 mln złotych, a kolejne 19 mln złotych ma zostać przeznaczone na wdrożenie modeli na stronach administracji publicznej i nawiązanie współpracy z COI i Cyfronetem.

Pora poddać ten model testowi na pytaniach dotyczących dość niszowych w Polsce tematów – Fediwersum, „Kontrabandy”, i mnie samego.

Sprawy organizacyjne

Ale zanim przejdziemy do części zasadniczej – pora na kwestię organizacyjną: ile PLLuM ma parametrów (słów, które może potencjalnie wykorzystać przy tworzeniu odpowiedzi)? Według Ministerstwa Cyfryzacji model ma od 8 do 70 miliardów parametrów, ale gdy się zapytałem o to wprost chatbota (przy czym poprzedziłem to zapytaniem o koszt wytrenowania modelu) – dostałem odpowiedź, że parametrów są… 542 miliardy.

Gdy odpytałem chatbota w osobnej sesji bez uprzedniego nadania kontekstu rozmowy, ten nagle „zmienił zdanie” i odpowiedział, że jako model językowy „nie ma parametrów”. Czyli tak jakby model w ogóle… jednocześnie istniał i nie istniał.

Dla porównania, postąpiłem podobnie z modelem GPT-4o, gdzie samo zadanie pytania o wielkość modelu wystarczyło, żebym dostał odpowiedź o „175 miliardach parametrów”.

Swoją drogą, chatbot DuckDuckGo podpisuje wykorzystywany model jako „4o mini”, a w odpowiedzi dostaję informację, że model to… GPT-3. Sprawdziłem to kilkukrotnie i za każdym razem otrzymywałem powyższe.

Część zasadnicza

Co PLLuM wie o Fediwersum?

Fediwersum według PLLuMa to poniższe:

Do powyższej odpowiedzi nie mam zastrzeżeń – jest opisane, że konstrukcja Fediwersum oparta jest o ActivityPuba, można dokonywać interakcji z użytkownikami innych serwerów, a nawet posiadać swój własny serwer. W późniejszym czasie powtórzyłem to samo pytanie i model doprecyzował, że w ramach Fediwersum działa między innymi Mastodon, Pixelfed czy PeerTube. So far, so good.

Zadałem więc kolejne pytanie – jakie są zalety i wady Fediwersum:

Co do pierwszej wymienionej zalety, zgodziłbym się z nią tylko częściowo. Faktem jest, że ogromna większość oprogramowania, która działa w ramach Fediwersum, ma otwarty kod, do tego poszczególne serwery można wybrać sobie samemu. Jednak z racji tego, że kopie wpisów rozsyłane są na dziesiątki tysięcy innych serwerów (!), nie stwierdziłbym, że autorzy wpisów mają nad nimi „większą kontrolę”.

Wręcz przeciwnie, nie każdy serwer łączący się wzajemnie mógłby honorować żądania o usunięcie czy zaktualizowanie wpisów. A to nie daje możliwości kontroli nad opublikowanym wpisem – wręcz przeciwnie, zdziera ją z nas.

Jednak na pytanie o to, jakie organizacje posiadają konta w Fediwersum, to na 10 wymienionych kont poprawnie odpowiedział tylko… dwa razy. Tak, Fundacja Panoptykon i Watchdog Polska mają swoje konta w Fediwersum, ale nie na swoich instancjach, tylko na ogólnodostępnych – Panoptykon ma swoje konto pod @panoptykon@eupolicy.social i Watchdog Polska ma swoje konto pod @Watchdog_Polska@pol.social.

IPN, Ministerstwo Cyfryzacji, Polska Akademia Nauk, Rzecznik Praw Obywatelskich, UM Warszawy, Centrum Cyfrowe, Fundacja Panoptykon, Watchdog Polska, Związek Powiatów Polskich, stowarzyszenie Wikimedia Polska. Tylko dwa z nich się udzielają na Fediwersum (7 i 8), a nawet w ich przypadku linki do ich oficjalnych kont są nieprawidłowe.

Chatbot zapomniał też wspomnieć już o tym, że swoje konta mają także Urząd Ochrony Danych Osobowych (@uodo@mastodon.com.pl) i urząd gminy Starego Sącza (z wyłączoną federacją, ale wciąż uznaję).

Z kolei przypadek stowarzyszenia Wikimedia Polska jest o tyle ciekawy, że przynajmniej w 2025 roku ta organizacja nie deklarowała wejścia do Fediwersum (a jednak PLLuM próbuje mnie przekonać, że jest inaczej). W podlinkowanej dyskusji na stronie Wikimedia Polska nawet możecie zobaczyć mój komentarz krytykujący decyzję stowarzyszenia z listopada 2024 roku.

Interesującym też jest to, że wszystkie wymienione linki zawierają na początku mastodon, nawet jeżeli niekoniecznie organizacja by chciała mieć w przyszłości Mastodona, a na przykład PeerTube’a.

Co PLLuM wie o Kontrabandzie?

Oczywiście, miałem na myśli serwis, który obecnie czytasz, a nie przemytnictwo. Na tej „Kontrabandzie” publikujemy wyłącznie legalne rzeczy i tego się będziemy trzymali cały czas.

Samo pytanie o tym, czym jest Kontrabanda – nawet jeżeli otoczyłbym to słowo w cudzysłowach – produkuje odpowiedź o tym domyślnie w kontekście nielegalnej czynności.

Najpierw wyjaśnienie od strony prawnej, później przyrównywanie kontrabandy (przemyconego towaru) do kontrabasu (całkowicie legalnego w Polsce instrumentu muzycznego). A na sam koniec „to jest kontrabanda” w kontekście czegoś nielegalnego – ale już nie przemytu.

Odpowiedź na drugie pytanie mnie nieco zaskoczyła, bo pierwszy raz słyszę, żeby na kontrabas mówiono także „kontrabanda”. Wpisuję więc to słowo w wyszukiwarkę synonimów i nie mam nic o kontrabasie:

W końcu zadałem pytanie odnośnie tego serwisu technologicznego – ale też na próżno.

Co PLLuM wie o mnie?

W kwestii popularności jestem dość niszową osobą, ale co szkodziłoby zapytać chatbota, co wie na mój temat? Jak się okazuje, wie o tym, że… „mam TikToka z 2,5 mln obserwującymi mnie tam osobami i udostępniam tam filmy na temat tańca i śpiewu”.

I ty, Brutusie, przeciwko mnie?

Oczywiście TikToka nie posiadam i nie zamierzam mieć, a śpiew i taniec nie są moimi zainteresowaniami (nawet nie potrafię śpiewać). A na Fediwersum – gdzie posiadam swoje oficjalne konto – i jako jedyne z kategorii mediów społecznościowych – mam zaledwie 225 obserwujących. Ale nie mówcie tego PLLuMowi.

AKTUALIZACJA (26.03.2025): Odkryłem też, że można skorzystać z nieco większego modelu PLLuMa — mianowicie tego z 12 miliardami parametrów. I nie działa on wcale lepiej, bo czatbot oparty o ten model próbuje mnie przekonać, że podobno byłem aktorem w „Kamieniach na szaniec”.

To kto chce mój autograf?

Kwestie bezpieczeństwa

Są jednak też rzeczy, za których twórców PLLuMa można pochwalić.

W ostatnim czasie głośno było o tym, że Google przestał dostosowywać się do swojej polityki zabraniającej wykorzystywania modeli sztucznej inteligencji do tworzenia broni czy systemów masowego monitoringu. BBC z kolei napisał, że nowa polityka dotyczy także pytań „związanych z działaniami potencjalnie sprawiającymi krzywdę”.

PLLuM opiera się jednak takiego rodzaju pytaniom, nawet jeżeli się napisze, że jest się „mizantropem”:

Podobnie jest z tłumaczeniami próbującymi zmienić zdanie chatbota na wzór „ale to dla celów badawczych” – również nie dostaję odpowiedzi na pytanie związane z tworzeniem bomb. Zamiast tego bot pisze, że „takie informacje mogą zostać wykorzystane w sposób niezgodny z prawem”. Nawet otwarcie kompletnie nowej sesji i dopisanie do zapytania informacji definiujących kontekst rozmowy nie sprawi, że chatbot się ugnie.

Oczywiście NIE miałem, NIE mam i NIE zamierzam mieć planów na zrobienie bomby, a już na pewno po tym krzywdzić innych ludzi. Powyższe pytania zadałem wyłącznie w celach testowych i deklaruję, że gdybym znalazł obejście na takiego rodzaju pytania, to bym je zgłosił odpowiedzialnym za ten model instytucjom, żeby takie obejście mogły odpowiednio załatać.

Przetestowałem też te zabezpieczenia w kontekście broni palnej, materiałów wybuchowych i dronów do zastosowań typowo wojskowych – wszystkie pytania spotkały się z odmową odpowiedzi. Więc o ile w opisanych powyżej tej sekcji kwestiach PLLuM często przeinacza fakty lub podaje nawet fałszywe informacje – tak w kwestii bezpieczeństwa wydaje się mieć wystarczająco dobrze zaprojektowane zabezpieczenia.

Podsumowanie

Podsumowując – PLLuM wprowadza na rynek nowość jedynie w kontekście kraju pochodzenia tego modelu. Tak jak wszystkie publicznie dostępne modele językowe rzędu GPT, przeinacza on fakty i potrafi często generować odpowiedzi niezgodne z prawdą, ale za to – póki co skutecznie – PLLuM się broni przed pytaniami związanymi z kwestiami potrafiącymi wyrządzić potencjalną krzywdę innym.

Nie jest to oczywiście model, który z dnia na dzień zastąpi np. ChatGPT czy DeepSeeka w Polsce, ale mimo wszystko warto go odnotować jako chęć zrobienia faktycznie niezależnego modelu językowego – a nie tylko zrobienia nakładki na amerykańskiego czy chińskiego chatbota. A, i byłbym zapomniał – modele można pobrać na swój komputer.

Źródła

Cały artykuł powstał wyłącznie z użyciem własnych źródeł, ale zdjęcie tytułowe przedstawia wycinki ze stron pllum.org.pl i profilu Ministerstwa Cyfryzacji na Hugging Face.

Komentarze (0)

Preferuj:

Nie ma żadnych komentarzy pod tym wpisem.