Amerykańska organizacja o nazwie The Authors Guild postanowiła uruchomić pozew zbiorowy w imieniu autorów ok. 7,5 mln książek, których skany zostały umieszczone na Libgenie. Jest to serwis, w którym można pozyskać darmowe skany książek (lub ich fragmentów) — jednak tamtejsze skany były tam publikowane z pogwałceniem praw autorskich wydawców. W 2024 roku z tego względu na operatorów Libgena nałożono karę finansową w wysokości 30 milionów USD.
The Authors Guild, powołując się na artykuł na „The Atlanticu”, uzasadnił uruchomienie pozwu tym, że Meta Platforms do trenowania swoich modeli sztucznej inteligencji wykorzystała wyżej wymienioną kolekcję.
Według aktów sądowych, wykorzystanie nielegalnie udostępnionego zbioru miał zatwierdzić sam Mark Zuckerberg — dyrektor generalny Mety Platforms. W jednym z e-maili został zastosowany skrót „MZ”, co najprawdopodobniej oznacza inicjały założyciela Facebooka.
W konwersacji nawiązano też, że wykorzystanie Libgena miał uzasadnić fakt, że model AI Mety „miał być w tyle za Mistralem [konkurencyjnym modelem AI produkcji francuskiej — przyp. aut.]„.
Jako potencjalne obejścia tego problemu wskazano też, żeby zespół odpowiedzialny za model AI Mety „nie dodawał do modelu informacji z książek z Libgena, o których wiadomo, że zostały «spiracone» lub skradzione”.
W świetle pozwu Meta Platforms wyjaśniła, że wykorzystanie zbiorów bez odpowiednich licencji do celów treningu modeli sztucznej inteligencji jest „zgodne z prawem”, ponieważ „wykorzystywane są na podstawie prawa cytatu [fair use — przyp. aut.]” — wzywając sąd w Stanach Zjednoczonych do nieuwzględnienia pozwu.
Okazuje się też, że niektórzy pracownicy Mety związani z tą sprawą byli świadomi potencjalnych konsekwencji — gdzie jeden z nich, Nikolay Bashlykov, zgodnie z zapisem konwersacji w wewnętrznym komunikatorze firmowym, napisał, że „«torrentowanie» książek z laptopa firmowego nie wydaje się być dobrym pomysłem”.
Meta Platforms nie skomentowała najnowszych doniesień w opisywanej w tym artykule sprawie.
Źródła
Zdjęcie tytułowe zrobione zostało przez użytkownika o pseudonimie Nokia621 i jest ono dostępne na Wikimedia Commons na licencji CC BY-SA 4.0 International. Treść artykułu powstała na podstawie następujących źródeł tekstowych i/lub audiowizualnych:
- Meta’s Massive AI Training Book Heist: What Authors Need to Know, opublikowany na stronie authorsguild.org w dniu 20.03.2025
- The Unbelievable Scale of AI’s Pirated-Books Problem, opublikowany na stronie theatlantic.com przez Alexa Reisnera w dniu 20.03.2025
- Meta says copying books was 'fair use’ in authors’ AI lawsuit, opublikowany na stronie reuters.com przez Blake’a Brittaina w dniu 25.03.2025
- Zapisy konwersacji z aktów sądowych: pierwszy i drugi, oba skany opublikowano w dniu 14.01.2025