Filip Sivák: Umělá inteligence někdy dělá hlouposti. Že by se obrátila proti člověku, si ale nemyslím

„V běžném životě AI velmi poslouží těm, kteří s ní spolupracují, a poškodí ty, kteří si myslí, že bude pracovat za ně,“ říká šéf oddělení vizuálních efektů AI ve filmové výrobě společnosti UPP („Head of AI for Visual Effects“), programátor Filip Sivák.
Termín umělá inteligence (AI) se dnes skloňuje téměř na každém rohu. Co to tedy vlastně je – jak mu rozumět, když si o něm teď budeme povídat?
Umělá inteligence je systém schopný simulovat nebo projevovat chování, které bychom považovali za inteligentní. Učí se z dat namísto striktního programování kroku za krokem. Může být schopný se přizpůsobit novým datům nebo situacím. Může vnímat pomocí interpretace obrazu, zvuku a dalších.
Asi ne všechno, co funguje „inteligentně“ je AI – například vysavače, co sami oběhnou a vyluxují byt. Jaký je vztah mezi AI a robotikou?
Robotický vysavač může být hloupý, může náhodně vrážet do všeho kolem sebe, a když náhodou narazí třeba na exkrement domácího mazlíčka, vyrobí na koberci nehezké umělecké dílo. Chytrý robotický vysavač využije umělou inteligenci, aby se exkrementu vyhnul. Stejně tak mohou být chytré drony, které vás budou sledovat, nebo hloupé, které poletí přesně tam, kam pohnete páčkou dálkového ovládání. Robotika se zabývá tělem robota a umělá inteligence dodává mozek.

Dnes už mnoho lidí docela běžně různé nástroje AI používá – třeba ChatGPT. Nejspíš jsme se s ní ale setkávali už dříve, aniž by se tomu vyloženě říkalo „umělá inteligence“. Bylo to třeba i obyčejné vyhledávání v Googlu?
Ano, vyhledávání v Googlu, ale například i systémy doporučení, jaké můžeme najít například v Netflixu nebo na sociálních sítích. AI je ale také automatické čtení SPZ, prohledávání databáze otisků prstů nebo třeba spam filtr v emailu. V automobilech je to například systém sledování dopravních pruhů, se kterým přišel první Nissan už v roce 2001.
Kde se AI vlastně vzala? Co považujete za její úplný počátek a jaké jsou nejdůležitější milníky v její historii?
První pokusy přišly už v 50. letech 20. století. Byla to simulace lidského myšlení pomocí logiky a symbolů. Velká očekávání však brzy vystřídal skepticismus a nedostatek investic. Takzvaná „zima“ do AI odvětví zavítala několikrát. Pro AI, tak jak ji známe dnes, tehdy chyběly tři základní ingredience. Výkon, který nám dnes poskytují grafické karty, vynález původně zamýšlený pro vášnivé hráče videoher. Data, která jsme nahromadili díky internetu. A správné uspořádání neuronové sítě. Velkým pokrokem byl takzvaný „Transformer“, který v roce 2017 publikovali výzkumníci Googlu. Paradoxně to nebyl Google, ale OpenAI, která této architektury využila a přišla s ChatGPT. Transformer umožňuje AI zaměřit svou pozornost tak, aby v informačním šumu našla klíčové informace. Ukazuje se, že právě výkon a data jsou klíčem k raketovému pokroku AI, který pozorujeme. Překvapující pro vědce je, že se AI s více daty stále rapidně zlepšuje, aniž by museli samotnou neuronovou síť revolučně inovovat. Kde má tento růst strop, je předmětem dlouhých debat.

AI může být „dobrý sluha, ale zlý pán“. V jakých oblastech podle vás nejvíce pomáhá a dokáže být opravdu prospěšná, a v jakých je naopak zneužitelná a může představovat rizika?
AI umožňuje, co se bez ní jeví jako zcela nemožné. Například nedávno vědci z Washingtonské nemocnice ukázali, že pomocí specializované AI lze navrhnout zcela nové proteiny, které fungují jako nový druh protilátky proti hadímu jedu. Tuto novou protilátku je jednoduší vyrobit i skladovat. Waymo, které provozuje samojezdící taxi nedávno publikovalo studii, která ukazuje, kolika nehodám se zabránilo díky okamžité reakční době jejich vozidel. AI již nyní doslova zachraňuje životy.
V běžném životě AI velmi poslouží těm, kteří s ní spolupracují, a poškodí ty, kteří si myslí, že bude pracovat za ně. Student, který se o domácím úkolu s AI baví, nechá si ho vysvětlit a pak sám vypracuje, na tom bude mnohem lépe než student, který zkopíruje zadání, pak zkopíruje odpověď a ani jedno si nepřečte.
Velké nebezpečí se pak skrývá v generovaném obsahu, který má někoho zmanipulovat. Zranitelné jsou zejména starší generace. Z placených reklam na ně útočí AI Babiš, který slibuje zúročení investic, nebo AI přítelkyně, která potřebuje peníze na letenku. Setkat se ale můžeme i s naprosto absurdním obsahem. Kraluje mu AI Ježíš uplácaný z písku nebo zeleniny, videa roztomilých hospodářských zvířat, která se vejdou do dlaně, nebo batolat na módních přehlídkách. I přes evidentní absurditu tento obsah spousta lidí komentuje zcela neironicky a vnímá ho jako realitu.

S předchozí otázkou také souvisí velké téma – etika. Kde spatřujete ta největší dilemata? A může vzít AI práci lidem?
Je jen otázka času, než na nás na internetu vyskočí reklama na svetr, ve kterém budeme oblečení my. Naše podoba, náš hlas a naše myšlenky, bylo něco, čímž jsme donedávna byli schopní disponovat jen my samotní. S příchodem AI exkluzivitu sebe samotných ztrácíme. V pátek 2. 5. přišlo Runway AI s funkcí „Reference“, která umožňuje nahrát fotku člověka a vygenerovat si video s ním. Podobnou funkcionalitu přináší Midjourney Omni den na to.
Pokud jde o trh práce, nejvíce trpí velmi specializované pozice, například v marketingu. Množí se hlasy lidí, kteří tvrdí, že je nahradila AI nebo méně kvalifikovaný člověk s AI. Na druhou stranu – předběžná studie Univerzity v Chicagu a Kodani založená na datech z roku 2023 a 2024 od tisíců pracovníků a pracovišť dospěla k závěru, že AI chatboty neměly během sledovaného období „žádný významný dopad na výdělky nebo evidované hodiny“ v žádném sledovaném povolání. Začít podnikat je nyní také jednodušší, když máte v kapse odborníka, který ochotně poradí 24/7.
Otázkou je také oblast sledování a soukromí. Přichází mi na mysl nedávná kauza. Ukazuje se, že AI „o3“ od OpenAI, dostupná v ChatGPT, je z fotky schopná vydedukovat, kde byla pořízena. Nedělá to z metadat, ale opravdu z obrazu a indicií dostupných ve fotografii. Mohou to být nápisy, vzdálená pohoří a kopce, směr slunečních paprsků, ale i nápadné sloupky nebo čáry na silnici. Tato disciplína se nazývá geoguessing, a byla donedávna doménou expertů, kteří se jím zabývají denně. Dnes si může každý, kdo má k této AI přístup, zkusit najít polohu fotografie, což má důsledky pro každého, kdo své fotky sdílí na sociální sítě.

Byli by jste schopní určit, kde se fotka nachází? AI ano! A to s přesností na 2.4 Km! Jedná se o silnici R477 v Irsku. A jak na to AI přišla?
- žluté čáry na kraji vozovky, které jsou charakteristické pro Irskou republiku
- zídky z nasucho kladených plochých šedých vápencových kamenů a vápencové výchozy (škrapová pole) silně ukazovaly na specifickou krasovou geologii oblasti Burren
- bílé registrační značky ve stylu EU
- výrazná zářivě žlutá dodávka na balíky
*Psal o tom Sam Patterson ve svém článku “o3 Beats a Master-Level Geoguessr Player—Even with Fake EXIF Data”
zdroj: https://sampatt.com/blog/2025-04-28-can-o3-beat-a-geoguessr-master
Velké diskuse se vedou také v oblasti ekologie. AI může v ochraně klimatu pomáhat – predikovat vývoj, chránit ohrožené druhy, dokáže třeba řídit úsporu energie apod. Zároveň je ale energeticky náročná, vyžaduje velkou spotřebu vody k chlazení serverů, produkuje elektroodpad apod. Jak to jde vlastně dohromady? V čem vidíte největší riziko a největší potenciál?
Minulý týden Google ohlásil financování výstavby třech jaderných elektráren. To ilustruje energetickou náročnost, se kterou se potýkáme. Datacentra se nyní měří v jednotkách energie, ne výkonu, jako tomu bylo dříve. Investice a další rozvoj ekologické jaderné energie je však prospěšný hodně lidem, stejně jako AI. A není to pouze o AI. Velmi energeticky náročný je také streaming. Netflix, TikTok, YouTube. Tuto debatu nelze vézt izolovaně zaměřenou pouze na AI. Kromě dopadů, bychom také měli zvážit užitek jednotlivých energeticky náročných online služeb. Kdybych si já osobně měl vybrat, zdali se vzdám TikToku, nebo AI, vzdám se raději TikToku.
Podobně je to s otázkou nerovností – některým oblastem, ať už společenským či geografickým, může AI pomoci k rozvoji a zisku, jiným naopak situaci ztížit, třeba tím, že ponesou právě ty ekologické důsledky, například z těžby lithia potřebného pro moderní technologie. Nůžky mezi „bohatými a chudými“ se tak mohou ještě více rozevírat. Jak tuto problematiku vnímáte?
Významný přímý ekologický dopad je na vodní zdroje. Ne všechna datová centra mají takzvanou „uzavřenou smyčku chlazení“, kde recyklují jedno chladicí médium stále dokola. Některá důležitou vodu doslova vypaří. Datová centra logicky vznikají na domácí půdě, protože se jedná o strategicky důležité objekty, které mocnosti odmítají stavět v zahraničí. Ekologické dopady tedy pocítí ten, kdo z AI nejvíce benefituje. Těžba vzácných kovů je samozřejmě stále velké zatížení chudších zemí.
Na druhou stranu mocnost investuje, nese část závažných dopadů, ale „poskytuje“ AI celému světu. Téměř každý student nyní má koho se zeptat, což byla doména jen bohatých rodičů, kteří platí doučování. Máme v kapse osobního trenéra, kuchaře, advokáta, prostě poradce na všechno. Mluví se o tom, že AI povznese zejména střední střídu a pracovní příležitosti pro ni spíše vytvoří, než sebere.

Jak k AI přistupujete vy osobně? V čem vám je užitečná i mimo pracovní oblast a co vás na ní nejvíce překvapilo?
Pro mě byl první velký wow moment takzvaný „vibe coding“. Programátor píše kód, a když se zastaví a zamyslí, AI ho doplní. Stačí pak stisknout jednu klávesu a kus kódu je hotový. Hodněkrát jsem si řekl, tyjo, přesně takhle jsem to myslel, díky. Je to, jako by „AI“ četla myšlenky.
Namísto placení předplatného pro použití AI raději využívám takzvané „API klíče“. Jsou určené pro vývojáře, ale může je použít kdokoliv. Platíte de facto za každé písmenko, které AI napíše. Ale protože se platí opravdu hodně málo, měsíční využívání může vyjít třeba u levného Gemini Flash 2.0 od Googlu na 1 americký dolar.
Google dokonce ty nejnovější modely, které jsou ve fázi testování, nabízí zcela zdarma. Vyzkoušet online se dají v Google AI Studio. Pokud ale chcete využít API klíč, musíte si jej nejdříve vystavit a stáhnout aplikaci, do které se API klíče dá zadat. Například ChatBox, který funguje jak na smartphone, tak na počítači.
AI rád využívám třeba na recepty, mohu ji požádat o přesnou gramáž nebo postup v odrážkách. Naopak návod, jak něco udělat v nějakém programu, často selže, protože si vždy vymyslí tlačítko, které neexistuje. Dává smysl, aby tam bylo, aby se tak jmenovalo, ale není tam. Pokaždé, když je v realitě něco neintuitivní, AI selže, protože funguje „intuitivně“. S těmito halucinacemi musíme počítat a není jednoduché je v AI nějak potlačit. Ostatně tyto chyby děláme často také a můžeme se slyšet: „Já myslel, že to má být takto, vždyť by to takhle dávalo smysl!“

Jak se vlastně umělá inteligence „učí“? Jedna věc je asi přístup k nějaké sumě dat a faktů, další věc je ale to, jak s nimi dokáže pracovat, analyzovat je a vyhodnocovat. To už dělá „sama“ nebo ji to taky musíme naučit my lidé?
Výzkumníci dají AI tvar (architekturu, jako třeba Transformer), data a jednoduchý úkol. AI se pak pomocí těchto dat snaží v úkolu zlepšovat. Úkolem AI typu ChatGPT je vypočítat pro otázku nejpravděpodobnější odpověď. Přesněji řečeno snaží se vypočítat, jaké tokeny (písmenka a interpunkce) nejpravděpodobněji následují po vstupním textu. Učící proces AI vždy řekne, jak upravit parametry, které má AI k dispozici. Těch jsou biliony, ovšem i přesto ani zdaleka nestačí, aby memoroval celá trénovací data. AI se proto musí učit tak, aby s omezenou pamětí dokázala vyřešit širokou škálu úloh. AI je student, který se namísto memorování snaží v datech najít vzory a zákonitosti.
Učení je pozvolné a je těžké rozeznat zlom, kdy AI už začne užitečně řešit úlohy a uvažovat. Proto se na první pohled může jevit hloupá, a naopak nás v některých úlohách až zaskočit vynalézavostí.
Důležitý je velký rozsah trénovacích dat. Trénuje se na téměř veškerém dostupném textu. Vsadím se, že v trénovací sadě byla také všechna čísla Romano voďi a časopis se tak vlastně spolupodílel na vytváření AI. Nedávnou kauzou je Meta přistižená při nelegálním stahování 82TB knih pro tréning své AI.
Nedávným pokrokem jsou takzvané „uvažující modely“, které nutí AI se zamyslet. Například OpenAI o1, o3 nebo čínský Deepseek-R1. Využívají mocné schopnosti psát text, a tak nutí AI, aby nejdříve o problému dlouze psala. Tento „interní monolog“ pak využívá k psaní přesnější odpovědi za cenu vyššího výpočetního výkonu při odpovídání.
I umělá inteligence někdy chybuje. Když namaluje postavě na obrázku šest prstů, může to být legrace, ale co když se objeví chyba například u automobilu nebo nějakého lékařského přístroje, které řídí?
V 80. letech právě chyba programátora zapříčinila, že ozařovací stroj Therac-25 pacientům náhodně administroval smrtelnou dávku ozáření. To vedlo k ustanovení základních pravidel kolem kvality softwaru. Díky tomu jsou dnes zdravotnické přístroje velmi bezpečné. Spíše, než že AI udělá chybu, udělá chybu vývojář. Například, když Tesla rozhodla, že na svých autech bude mít pouze kamery, a ne žádné pokročilé senzory, jako je LiDAR (takový laserový radar). Automobil pak ošálí cesta nakreslená na stěnu jako z nějakého animovaného filmu pro děti, což ukázal ve svém videu nedávno Mark Rober.



Hodně se také debatuje o tom, jestli jednou může AI člověka „přerůst“ – ve výkonnosti, rozhodování, autonomii nebo se proti člověku obrátit…
Sam Altman, CEO OpenAI, tvrdí, že do konce roku 2025 budeme mít AI lepší než odborníky. Již dnes v některých úlohách AI člověka předčí. Autonomní naopak AI vůbec není, když to řeknu zjednodušeně, čeká, až jí něco napíšeme, a sama od sebe nic neudělá. V autonomii se AI nevěří, protože čas od času má tendenci dělat hlouposti. Když už se dá AI nějaká autonomie, má velmi omezený výběr akcí, které může provést. Že by se obrátila proti člověku, si nemyslím. Jak jsem řekl, ve svém jádru AI předpovídá další slovo. Architektura AI, tak jak je dnes navržená, nemůže měnit sama sebe nebo působit autonomně.
Zdroj článku: časopis Romano voďi.
