Čínské AI posiluje, vlastní GPU nadohled. A další dubnové novinky v AI aplikacích

💡 Firemní workshopy o umělé inteligenci - pojďme se zamyslet nad tím, jak se vaší firmy dotkne AI a jak se na to připravit!

Patrick Zandl · 28. duben 2025

Čínské AI posiluje, vlastní GPU nadohled. A další dubnové novinky v AI aplikacích
Rychlé shrnutí článku
  • Baidu představil cenově výhodné modely ERNIE 4.5 Turbo a ERNIE X1 Turbo s konkurenceschopnými cenami a výkonem.
  • OpenAI rozšířil přístup k Deep Research Mini a představil GPT-Image-1 pro generování obrázků.
  • xAI vylepšil Grok o dlouhodobou paměť, multimodální funkce a reálné vyhledávání.
  • Čína posiluje soběstačnost v AI s novými čipy Huawei a vládní podporou vývoje.

Pojďme se podívat na průlet novinkami v AI na druhou půlku dubna. A ano, máte pravdu, novinky se hromadí! Čínské společnosti představily nové konkurenty pro západní modely, OpenAI pokračuje v rozšiřování svého ekosystému, a i menší hráči přicházejí s inovativními technologiemi. Pojďme se podívat na nejdůležitější oznámení, která formují budoucnost umělé inteligence.

Baidu: Cenově dostupné “Turbo” modely

Čínský technologický gigant Baidu vstupuje do přímé konkurence s OpenAI a DeepSeek prostřednictvím svých nových cenově výhodných modelů ERNIE 4.5 Turbo a ERNIE X1 Turbo.

ERNIE 4.5 Turbo nabízí pokročilé multimodální schopnosti za pouhých 11 centů a 44 centů za milion vstupních/výstupních tokenů, což představuje pouhých 0,2 % ceny GPT-4.5. Model vyniká rychlostí, logickým uvažováním, redukcí halucinací a programovacími schopnostmi. Podle benchmarků obstojí ve srovnání s GPT-4.1 a v některých měřeních dokonce překonává GPT-4o.

ERNIE X1 Turbo, navržený pro hloubkové přemýšlení s vylepšenými schopnostmi řetězení myšlenek (chain-of-thought), se prodává za 14 centů a 55 centů za milion vstupních/výstupních tokenů, čímž překonává modely DeepSeek R1 a V3 nejen výkonem, ale i cenou, která je jen zlomkem ceny jeho předchůdce.

Baidu současně oznámilo několik nových AI aplikací. Nejpozoruhodnější je Xinxiang, aplikace pro multi-agentní spolupráci, která transformuje jednotlivé pokyny do kompletních pracovních postupů napříč 200 typy úloh, s plány na rozšíření až na 100 000. Společnost také představila nový operační systém Cangzhou OS, který usnadňuje multimodální vytváření poznámek.

Svou AI Open Initiative a standard MCP společnost Baidu cílí na usnadnění vývoje aplikací na těchto modelech. Jak uvedl Robin Li na konferenci Baidu Create 2025: “Modely jsou důležité, ale skutečnými vítězi budou aplikace, které je oživí.”

OpenAI: Rozšíření funkcí a přístupnosti

OpenAI nezůstává pozadu a nadále rozšiřuje svůj ekosystém produktů a služeb:

Deep Research Mini

OpenAI představil odlehčenou verzi své funkce Deep Research, která zpřístupňuje pokročilé výzkumné nástroje širšímu okruhu uživatelů. Tato “odlehčená” verze, poháněná modelem o4-mini, je “téměř stejně inteligentní” jako plnohodnotná verze, ale poskytuje kratší odpovědi a spotřebovává méně zdrojů. Společnost rozšířila limity používání pro uživatele úrovní Plus, Team a Pro a zpřístupnila tuto funkci i bezplatným uživatelům. Jakmile jsou vyčerpány limity pro plnou verzi, dotazy uživatelů se automaticky přepnou na odlehčenou verzi.

Nové limity:

  • Free – 5 odlehčených úloh/měsíc
  • Plus & Team – 10 plných + 15 odlehčených úloh/měsíc
  • Pro – 125 plných + 125 odlehčených úloh/měsíc
  • Enterprise – 10 plných úloh/měsíc

GPT-Image-1

OpenAI zveřejnilo svůj nový model pro generování obrázků v API. Model, který dokáže pracovat jak s textem, tak s obrázky, pohání funkci vytváření obrázků, která byla spuštěna v ChatGPT na konci března a uživatelé s ní během prvního týdne vytvořili přes 700 milionů obrázků. Pro vývojáře je model dostupný za cenu 5 USD za milion textových tokenů, 10 USD za vstupní obrazové tokeny a 40 USD za výstupní obrazové tokeny.

Aktualizace GPT-4o

OpenAI také aktualizovalo svůj model GPT-4o, čímž vylepšilo jeho schopnosti řešení problémů, inteligenci a osobnost. Nicméně CEO Sam Altman později sdílel, že aktualizace učinila asistenta “servílním a otravným” (i když s některými pozitivními aspekty) a společnost nyní pracuje na nápravě.

Finanční cíle a partnerství

OpenAI sdělila investorům, že očekává dosažení příjmů ve výši 125 miliard dolarů v roce 2029 a 174 miliard dolarů v roce 2030, díky AI agentům, předplatným, monetizaci bezplatných uživatelů a affiliate poplatkům. Společnost také oznámila partnerství s deníkem The Washington Post na vyhledávací obsah a s aerolinkami Singapore Airlines pro vylepšení jejich virtuálního asistenta.

Liquid AI: Hybridní architektura

Liquid Sciences představila Hyena Edge, hybridní AI model s “konvoluční” architekturou. Tato technologie poskytuje rychlejší zpracování a vylepšené benchmarkové výsledky, překonávající základní modely založené na transformerech jak v oblasti výpočetní efektivity, tak v kvalitě modelu na edge hardwaru.

xAI: Grok s novými funkcemi

xAI představilo Grok Studio s dlouhodobou pamětí, čili si můžete přát, aby si Grok o vás něco zapamatoval, třeba že vám má tykat. Platforma nabízí rozdělené rozhraní, kde mohou uživatelé vytvářet dokumenty, aplikace nebo hry. Důležitou funkcí je schopnost pamatovat si minulé konverzace, což činí systém chytřejším v průběhu času.

Grok Vision byl spuštěn s výkonnými multimodálními funkcemi, které uživatelům umožňují namířit fotoaparát telefonu na objekty nebo prostředí a získat okamžitou analýzu v reálném čase. Spolu s tím byla přidána podpora zvuku v několika jazycích a funkce vyhledávání v reálném čase, což činí celý zážitek interaktivnějším a užitečnějším.

Elon Musk oznámil, že vylepšený algoritmus X (Twitter) poháněný AI modelem Grok bude brzy k dispozici. Toto oznámení přišlo jako reakce na stížnost Paula Grahama ohledně zahlcení feedu X příspěvky od levicových nebo pravicových trollů.

Google: Gemini 2.5 Flash

Google představil Gemini 2.5 Flash – rychlý, odlehčený AI model. Navzdory tomu, že je navržen pro rychlost a efektivitu, Gemini 2.5 Flash se v benchmarkových testech řadí na sdílené druhé místo. Jeho výkon je srovnatelný s top modely jako GPT-4.5 Preview a Grok-3, což dokazuje, že i lehčí modely mohou nyní soupeřit s těmi nejlepšími z hlediska kvality a uvažování. Jestli to tak skutečně bude i v praxi, tak se Google povedl hezký zásek.

Anthropic: Výzkumné schopnosti pro Claude

Anthropic přidává “Autonomní výzkum” do svého modelu Claude. Ten nyní dokáže vyhledávat v Google Workspace, zpracovávat vícekrokové otázky a poskytovat odpovědi s řádnými zdroji. Systém zkoumá dotaz z různých úhlů, provádí výzkum a dodává odpovědi během několika minut, čímž poskytuje dobrý mix hloubky a rychlosti pro každodenní úkoly. Kromě toho přidal do iOS aplikace hlasového asistenta, který dělá ze Siri hloupoučkou nánu. Jmenuje se Perplexity Assistant a je nyní dostupný na iOS, dříve již byl na Androidu. Přichází nejen s hlasovým ovládáním, ale i s možností propojení s více aplikacemi. AI asistent nyní dokáže pomáhat s úkoly jako je rezervace večeře, objednávání jízd a nastavování připomenutí.

Amazon: Nova Sonic

AWS představil Amazon Nova Sonic, špičkový základní model převodu řeči na řeč, navržený pro vylepšení interakcí se zákazníky a virtuálních asistentů. Umožňuje přirozenější, lidštější konverzace s AI, která chápe kontext a poskytuje bohatší odpovědi.

Menší, ale inovativní hráči

Kling AI představil Kling 2.0 s vylepšenými funkcemi, včetně lepšího pochopení pokynů, vylepšeného pohybu postav pro plynulejší a přirozenější pohyb a Multi-Elements Editoru, který usnadňuje úpravu videí.

Tavus představil nový, pokročilý lipsync model, který přináší bezkonkurenční realismus do vytváření videí ze zvuku. Model zajišťuje dokonalé pohyby rtů, které odpovídají zvuku, spolu s přirozenými výrazy obličeje, což činí videa mnohem realističtějšími.

Nari Labs uvedla model Dia 1.6B s pozoruhodným emocionálním rozsahem a přirozeností, schopný smát se a dokonce kašlat. Model je dostupný na HuggingFace.

Moonshot AI spustila Kimi-Audio, nový open-source univerzální audio model. Podporuje rozpoznávání řeči, převod zvuku na text a převod řeči na řeč. Model byl předtrénován na více než 13 milionech hodin zvukových dat a vyniká v více než 10 audio benchmarcích, včetně MMAU, VoiceBench a LibriSpeech.

Dreamina AI představila Seedream 3.0, který se řadí na první místo v tvorbě fotorealistických obrázků s rozlišením až 2k. Dokáže také zvyšovat rozlišení, vyplňovat, rozšiřovat a dokonce generovat videa.

Genspark představil AI Slides, nový nástroj, který mění způsob vytváření prezentací pomocí výkonného systému řízeného agenty. AI provádí výzkum témat, vytváří podpůrný vizuál včetně obrázků a grafů a dokáže transformovat různé typy dokumentů do profesionálně vypadajících prezentací.

Canva uvedla Visual Suite 2.0 – své dosud největší spuštění. Nová sada přináší výkonné AI funkce, které umožňují vytvářet dokumenty, prezentace, webové stránky a další obsah, vše v rámci jednoho designu. Jedná se o nejvýznamnější vydání produktu společnosti od jejího založení.

Microsoft vylepšil Copilot pomocí Studio, které nyní umožňuje vytvářet agenty, kteří mohou klikat a psát napříč desktopovými nebo webovými rozhraními. Kromě toho Vision v Edge nyní komentuje vše na obrazovce v reálném čase, což činí systém interaktivnějším a přístupnějším.

Hrozba ze strany Číny pro americkou dominanci

Čínský prezident Si Ťin-pching prohlásil soběstačnost v oblasti AI za národní prioritu a slíbil vládní podporu pro posílení vývoje AI čipů, softwaru a talentů uprostřed eskalujícího technologického soupeření s USA. Si načrtl přístup “nového celonárodního systému”, zaměřeného na vývoj špičkových čipů a softwaru a zároveň na zvýšení vzdělávání v oblasti AI a rozvoj talentů.

Čínský výrobce čipů Huawei podle zpráv testuje nový pokročilý čip, který by měl nabídnout domácí alternativu k procesorům NVIDIA, které jsou v současnosti omezeny ze strany USA. Huawei chce, aby její nový čip Ascend 910D nahradil některé špičkové produkty od Nvidie. Nový čip je stále v raných fázích vývoje a bude vyžadovat testování, než bude moci být dodán zákazníkům. Huawei očekává, že první z těchto nových čipů dostane asi za měsíc a doufá, že čip bude výkonnější než Nvidia H100.

Současně se šíří zvěsti o nadcházejícím vydání DeepSeek R2, s nižšími cenami a náklady na trénink a s využitím čipů Huawei místo NVIDIA.

Kombinace potenciálního druhého “DeepSeek momentu” za rohem, domácích alternativ AI čipů, které činí americké exportní kontroly neúčinnými, a rychle se uzavírající mezery v modelech ukazuje, že Čína zintenzivňuje své úsilí o získání vedení v oblasti AI, přičemž dokazuje, že k úspěchu nepotřebuje americké čipy.

Chcete tyto články emailem?

Twitter, Facebook, Opravit 📃