Tento měsíc také představila vedoucí společnost v oblasti umělé inteligence OpenAI svůj nový model umělé inteligence nazvaný GPT-4o. Čím se liší od toho předešlého? Ve jméně jen tím písmenkem O, což znamená Omni. Firma tím chce zdůraznit rozsáhlé možnosti vstupu a výstupu dat, od klasického textového zadání, přes obrazové či třeba hlasové zadání.
Základní parametry nového modelu jsou přímo úžasné. Je podstatně rychlejší, než model GPT-4, poradí si s textem, zvukem i obrázky najednou a jeho výstup je lepší, než u jiných modelů. A co je na tom nejlepší, je zdarma. Jenže tady se právě dostáváme k palčivé otázce. Je to nějak málo. Neříkal jsem to v tomhle newsletteru už jednou?
Ano, nový Omni model můžete používat ke konverzaci, kdy si přímo v reálném čase povídáte s hlasovým výstupem ChatGPT. A někoho už samozřejmě napadlo pustit proti sobě dva takové modely a sledovat, jak si spolu popovídají. Inu, popovídaly si pěkně. Jenže, po pravdě řečeno se čekalo tak nějak více. Očekávání přiživoval publikovanými náznaky Sam Altman, takže se čekalo GPT-5 nebo alespoň vyhledávací nástroj založení na umělé inteligenci.
Nejsem sám, komu je to málo. Už delší dobu se šušká, že AI je nyní v období “technologické pauzy”, tedy v době, kdy se musí nastřádat několik technologických inovací najednou, aby se celé odvětví mohlo “zázračně” posunout dále. To se běžně stává, LLM modely posunula obrovsky před pěti lety technologie transformátorů společně s Word2vec - přičemž jedno bez druhého nemělo pro AI valný smysl.
A tak čekáme, co bude. Možná nás OpenAI nakonec překvapí generačně lepším GPT-5, možná si jen dáme pauzu, během níž bude vývoj AI spíše inkrementální…
GPT-4o si neporadí se vším, její variabilita a schopnost pracovat nad obrázky textovými příkazy je ovšem fascinující. Chyby ovšem stále evidentní.