Průmyslová revoluce devatenáctého století nám po sobě zanechala rozsáhlou veřejnou infrastrukturu. Postavily se silnice - vlastně první pořádné silnice od pádu Římské říše. Postavila se železnice, přístavy, majáky, školy a univerzity, knihovny, později i letiště. Vznikl rozsáhlý soubor infrastruktury, kterou bylo možné použít za férových a transparentních podmínek, často zdarma.
A proč to bylo důležité? Protože když jste chtěli podnikat, najednou jste měli vyřešenou spoustu problémů. Měli jste jak dostat zboží do sousedství i do celého světa. Měli jste jak získat vzdělanou pracovní sílu pro svou novou továrnu. Z veřejné infrastruktury rostl užitek, který rozhojňoval zaměstnanost, pokrok a samozřejmě i privátní majetek.
Zatímco většina továren z devatenáctého století neexistuje, veřejná infrastruktura je dnes pilířem každého podnikání. Technologická revoluce proměnila obrovské investice ve výstavbu infrastruktury, která se stala základem budoucího bohatství.
Nyní, o 150 let později, jsme v podobné situaci. Jenže jakou infrastrukturu lze vybudovat z informací? Jak si představit infrastrukturu informačního věku?
Nástup umělé inteligence ukázal, co je budoucí informační infrastruktura:. Třeba velké jazykové modely. Jsou nástrojem, jak počítače naučit chápat význam přirozeného textu či slova. Jsou nadějí na to, že počítače budou moci “programovat” i lidé, kteří programovat neumí. Umělá inteligence je počítačovým rozhraním budoucnosti.
Spočítat jazykový model dá spoustu práce. Nejenom, že musíte sehnat dost podkladových dat, ještě potřebujete, aby vazby v nich počítače vyhodnotily. To stojí strojový čas a energii. Podle odhadů stálo společnost OpenAI natrénovat model GPT-3 kolem pěti milionů dolarů jen v ceně energie, zhruba 120 milionů korun.
Co z takového jazykového modelu počítačový svět má? Jazykový model GPT-3 se stal standardem pro implementace umělé inteligence, jeho verzí je i generátor obrázků Dall-E od téže firmy. Ano, to je ten zázračný generátor, kterému řeknete “nakresli papouška ve stylu Picassa” a on vám vygeneruje fotorealistický obrázek. Z GPT-3 vychází většina dobrých chatbotů, AI editorů a vůbec většiny služeb, které za svůj vstup používají přirozený jazyk.
Více jak 93 % tréninkových dat pro GPT-3 bylo v angličtině, jen zbývajících 7 % v jiných jazycích. Proto v jiných jazycích dává implementace GPT-3 velmi slabé výsledky. Existují sice i jiné jazykové modely - v češtině třeba Czert či RobeCzech . jenže neměly prostředky, jako OpenAI, takže dat je v nich málo. A bohužel u jazykových modelů je množství zpracovaných dat důležité. Asi tak, jako u železniční a silniční sítě délka v kilometrech.
Začíná se tomu říkat umělointeligenční chudoba. Když v jazyku neexistuje dost dat v modelech, vlastně se nedá pro umělou inteligenci používat. A jazyk tím ve světě UI pomalu umírá. Proto některé vizionářské státy s méně frekventovanými jazyky vrhají peníze do jazykových modelů, které zpřístupňují a opensourcují. Nechtějí být mimo. České univerzity vytvořily řadu zajímavých nástrojů pro infrastrukturu informačního věku, bohužel ale většina z nich je pro komerční svět nepoužitelná. Nástroje vytvořené z veřejných prostředků slouží jen k výuce žáků nebo jako demo weby, které nikdo nepoužívá. Znáte umělointeligenční překladač Google Translate? Velmi pravděpodobně. Německý Deepl? Zřejmě ano, je skvělý. Na Karlově univerzitě vznikl překladač, který je podobně dobrý, jen nikdo neinvestoval peníze ani do jeho použitelné webové podoby, ani do jeho propagace, takže jej nikdo nepoužívá a nezná…
Produkty s jazykovými modely teprve začínají. Tak například takzvané TTS systémy, řečové modely převádějící psaný text do přirozené řeči. Používají se pro hlasový výstup, například pro telefonní centrály. Rozdíly v kvalitě českých a anglických jazykových modelů jsou propastné. Zatímco nejmodernější anglické hlasové výstupy TTS těžko poznáte od živého mluvčího, české modely se nedají poslouchat delší dobu. Můžete je použít opravdu jen pro vygenerování krátkých hlášek. Nemůžete vytvořit systém v češtině, se kterým si opravdu popovídáte a nebude vás to tahat za uši.
Jestli čeština má přežít, bude potřeba v průběhu příštích deseti let do takových modelů investovat a nabídnout je všem. To bude stát stovky milionů korun. I změnu přístupu k licenčním podmínkám na straně univerzit. Proč? Protože chceme stavět moderní služby na veřejné informační infrastruktuře, kterou nemá cenu vytvářet pro každý produkt zvláště. Už jen takový digitální úřad: mohli byste na něj zavolat uprostřed noci a zeptat se na informaci, kterou by systém řízený AI okamžitě získal a do telefonu vás o ní informoval. A ještě vám popřál hezký den. Jenže v češtině teď nic takového opravdu dobře fungovat nebude…
Inu, národní hrdost se tu a tam dá přepočítat na peníze, tu a tam na činy a někdy je také potřeba prozíravě zainvestovat z veřejných prostředků něco, co přinese prospěch všem.
Psáno pro Lidové noviny