Frustrující realitou pro dnešní tvůrce je, že jejich práce je vystavena trénování AI. Technologické společnosti vyvíjející generativní AI, jako jsou ChatGPT, Gemini, DeepSeek, Stable Diffusion a Midjourney, potřebují k trénování svých modelů obrovské datové sady a pro tento účel stahují data z veřejného internetu.
To vyvolalo důležité otázky ohledně souhlasu, uvedení autora a kontroly nad tvůrčí prací po jejím sdílení online.
Pokud hledáte způsoby, jak lépe chránit svá kreativní data, tento průvodce nastiňuje praktické kroky, které můžete podniknout ke snížení míry využití vaší práce při trénování AI, a přitom se stále zapojovat do dění na internetu podle vlastních podmínek.
- Jak může trénování AI na veřejném obsahu ohrozit tvůrčí práci
- Jak zabránit AI v používání vašeho umění
- Vaše umění jsou citlivá data
Jak může trénování AI na veřejném obsahu ohrozit tvůrčí práci
Nástroje generativní AI vyžadují ke svému fungování velké množství dat a velká část těchto dat pochází z internetu. Společnost OpenAI veřejně uvedla(nové okno), že bez přístupu k materiálům chráněným autorskými právy nalezeným online by bylo „nemožné“ trénovat AI, jako je ChatGPT.
Kreativní díla z online portfolií, platforem sociálních médií a blogů jsou využívána k trénování těchto modelů bez souhlasu nebo uvedení autora. Společnost Meta například přiznala(nové okno), že ke trénování svých modelů generativní AI stahuje veřejně sdílené příspěvky, fotografie a komentáře na Facebooku a Instagramu až z roku 2007. To znamená, že jakékoli kreativní dílo, které jste kdy veřejně sdíleli na těchto platformách – jako jsou svatební fotografie, snímky z portfolia nebo ilustrace – by mohlo být použito pro trénování AI, pokud jste nenastavili viditelnost na soukromou.
Společnosti zabývající se AI v probíhajících soudních sporech(nové okno) argumentovaly, že trénování na datech stažených z internetu spadá pod „fair use“ (spravedlivé užití). Zároveň s výslednými modely a datovými sadami nakládají jako s vlastním majetkem. Podmínky služby OpenAI zakazují „používání výstupu k vývoji modelů, které konkurují OpenAI“, a společnost obvinila DeepSeek z „nevhodného“ kopírování(nové okno) jejích modelů – stejných modelů trénovaných na veřejně dostupných internetových datech.
Tento zjevný dvojí metr pomáhá vysvětlit, proč mají mnozí tvůrci pocit, že jejich práce je zranitelná vůči trénování AI bez jejich souhlasu, kreditu nebo kompenzace. Vyvolává to také širší otázky o tom, jak je interpretován „veřejně dostupný“ obsah, zejména pokud je tvůrčí práce sdílena na platformách, jejichž licence výslovně omezují neoprávněné opětovné použití nebo komerční zneužití. V důsledku toho se mnoho umělců, spisovatelů a fotografů stále více brání stahování dat umělou inteligencí.
Jak zabránit AI v používání vašeho umění
Vzhledem k tomu, že soudy stále vydávají rozhodnutí případ od případu a neexistuje jasný právní standard, nemohou se tvůrci při ochraně své práce spoléhat pouze na právní systém. Mezitím existují praktické kroky, které můžete podniknout hned teď, abyste omezili, jak je vaše práce využívána při trénování AI.
Žádná z těchto strategií však není stoprocentní; nástroje na ochranu a společnosti zabývající se AI se neustále snaží navzájem vyzrát. Prozatím o nich přemýšlejte jako o jednotlivých částech brnění, které fungují lépe společně. Toto jsou nejlepší způsoby, jak získat větší kontrolu nad svými kreativními daty:
Maskujte svůj umělecký styl
Nástroje pro maskování, jako je Glaze(nové okno), ztěžují modelům AI trénování na vaší práci tím, že provádějí drobné změny v pixelech, které modely AI matou. Obrázek se lidem jeví tak, jak bylo zamýšleno, ale pro AI stahující data se registruje jako odlišný nebo zkreslený styl.
„Otrávit“ své umělecké dílo
Pomocí nástrojů, jako je Nightshade(nové okno), můžete svá umělecká díla učinit jedovatými pro stahovače dat AI. „Otrávený“ obrázek obsahuje jemné, neviditelné změny, které narušují trénování AI a způsobují, že systém špatně interpretuje to, co vidí, například auta místo koček nebo mraky místo letadel. Časem, pokud se k trénování použije dostatek otrávených obrázků, se tyto nesprávné asociace mohou projevit v budoucích verzích modelu.
Technické ochrany jako Glaze a Nightshade však nejsou stoprocentní a výzkum(nové okno) ukazuje, že mohou být oslabeny s vývojem systémů AI.
Odhlásit se z trénování AI
Pokud vaše práce existuje online, je pravděpodobné, že byla stažena do modelu AI. Pomocí webů jako Have I Been Trained(nové okno) a AI Watchdog(nové okno) od The Atlantic můžete zkontrolovat, zda se vaše obrázky, texty nebo jiná kreativní práce objevují ve známých datových sadách používaných k trénování modelů AI. První z nich vám umožňuje odeslat vaši práci do registru „Do Not Train“ (Netrénovat), kde zúčastněné společnosti mohou tyto obrázky identifikovat a vyloučit z budoucích tréninkových běhů. Tato opatření jsou však dobrovolná, závisí na ochotě jednotlivých společností je dodržovat a nemají vliv na modely, které již byly na vaší práci vytrénovány.
Pokud žijete v EU, můžete využít zákony na ochranu údajů, jako je GDPR(nové okno), ve svůj prospěch tím, že požádáte společnosti o vyloučení vašeho obsahu z trénování AI. Některé společnosti mají procesy odhlášení skryté v nastavení svých aplikací; zde je například návod, jak se odhlásit z používání dat Meta AI na Facebooku, Instagramu a WhatsAppu.
Zabezpečte si nastavení soukromí
Omezte to, co veřejně zveřejňujete na sociálních sítích, a ujistěte se, že váš profil je nastaven jako soukromý. Čím méně obsahu je volně přístupného, tím hůře se stahuje externími systémy AI. To však nemusí stačit k vaší ochraně před samotnou platformou, protože mnoho společností stále více integruje funkce AI – například Meta využívá všechny interakce s Meta AI pro trénování a reklamy – což vyvolává otázky, jak může být veřejný i soukromý obsah časem využit. Je nejlepší vyhnout se používání sociálních médií jako primárního archivu nebo portfolia.
Buďte uvážliví při veřejném sdílení
Při veřejném zveřejňování příspěvků pro vaše publikum sdílejte menší verze své práce s nižším rozlišením nebo opatřené vodoznakem. Soubory v plné kvalitě uchovávejte v offline zálohách nebo cloudových službách, které jasně nepoužívají soukromý obsah pro trénování AI.
Bezpečně ukládejte a sdílejte soubory
Vzhledem k tomu, že nástroje AI jsou stále hlouběji integrovány do hlavních platforem – například Google přidává Gemini všude, včetně Disku Google a Gmailu – jsou lidé stále opatrnější, pokud jde o způsob ukládání a sdílení jejich práce.
Proton Drive poskytuje koncově šifrované úložiště a sdílení pro vaše fotografie, videa, alba, dokumenty, tabulky a další soubory. Vaše data nikdy neshromažďujeme, nezpracováváme, nesdílíme s třetími stranami ani je nepoužíváme pro trénování AI. Na rozdíl od technologických gigantů (Big Tech) je Proton plně podporován naší komunitou platících předplatitelů, nikoli reklamou nebo využíváním dat.
Můžete sdílet odkazy chráněné heslem, nastavit data vypršení platnosti, udělit přístup konkrétním lidem pouze prostřednictvím e-mailu a kdykoli přístup odvolat. Můžete také bezpečně shromažďovat soubory od lidí, kteří nemají Proton účet.
Používejte soukromou AI, aniž byste se vzdali kontroly
Pokud chcete využívat výhod AI, aniž byste se vzdali kontroly nad svou prací a aniž byste se museli obávat, že budoucí změna zásad náhle změní vaše soubory na trénovací data, použijte našeho soukromého AI asistenta(nové okno). Lumo nikdy netrénuje na vašich souborech nebo konverzacích a je založeno na open-source kódu, což znamená, že kdokoli může naše tvrzení ověřit.
Lumo se integruje s Proton Drive, což vám umožňuje bezpečně pracovat s vašimi soubory a generovat obrázky, aniž byste přispívali do ekosystému stahování dat AI, proti kterému se tolik jednotlivců a organizací aktivně brání.
Vaše umění jsou citlivá data
Zastavení krádeží umění pomocí AI neznamená úplné odmítnutí AI. Znamená to však uznat, že tvůrčí práce jsou citlivá data, ať už jde o ilustraci, román nebo píseň. Tvůrci si zaslouží svobodnou vůli a spravedlivé zacházení, včetně možnosti rozhodnout, jak a zda bude jejich práce použita.
Žádná jednotlivá strategie nemůže plně zabránit systémům AI v tom, aby do svého trénování absorbovaly veřejně dostupný obsah – a v některých případech nepřímo vystavený soukromý obsah. A společnosti zabývající se AI vás budou přesvědčovat, že neexistuje způsob, jak vytvářet nástroje AI bez použití vašich dat. My nesouhlasíme(nové okno).
Dokud regulátoři a soudy neposkytnou jasnější vodítka, nejefektivnějším přístupem je být proaktivní v tom, jak interagujete s internetem, a vybírat si platformy, které jasně respektují vaše soukromí a tvůrčí práva.






