Aktualizováno 7.11.2024 Jednou z aplikací umělé inteligence, kterou používám prakticky rutinně, je zápis ze schůzky, porady či jednání. Pojďme se podívat na to, jak to funguje.
V poslední době totiž nastal boom aplikací, které službu shrnutí či zápisu umožňují a řadu z těchto aplikací lze prakticky používat i v češtině. A tím je třeba začít: nebudu zmiňovat aplikace, jako je Otter, dnešní leader trhu, ten ale podporuje jen angličtinu a s jinými jazyky u něj neuspějete.
V českém prostředí jsem vyzkoušel Wave AI, Summie, Lush a MinutAI, u ostatních jako Osmo nebo Otter jsem neviděl podporu češtiny. U aplikací uvádím, zda mají verzi pro iOS a/nebo Android. Ceny jsou uváděné pro lidi přihlášené přes český obchod, mohou se lišit.
Jde o mobilní aplikace. Nainstalujete si je do svého mobilu a na začátku schůzky prostě spustíte nahrávání, po konci jej ukončíte a data se odešlou do cloudu. Proto je třeba dát si pozor na to, zda jste na WiFi a případně přenos odložit, data nebývají příliš komprimovaná a z jedné hodinové schůzky odešlete větší desítky megabitů dat, pokud máte ostřejší limit dat na mobilu, můžete být rychle na dně. Je potřeba si to hlídat a případně data ke zpracování odesílat až z wifiny.
Jak je to s cenami?
Aplikace | Zdarma | Za peníze | Poznámky |
---|---|---|---|
Wave AI | 30 minut měsíčně | 10$ za 5h, 20$ bez limitů | iOS, Android verze, chystají webovou službu |
Summie | do 15 minut zdarma max 69 minut měsíčně | kreditní systém 69 minut za 2 €, 5 hodin za 7 € a 10 hodin za 10 € | iOS |
Lugh) | na žádost autorovi | měsíční poplatek 400 Kč s limitem délky schůzky 2700 minut či 700 Kč bez limitu délky | iOS |
MinutAI | vše zdarma | zatím nestanoven | iOS, Android |
Notta | do 3 minut, prakticky nepoužitelné | 110 $ ročně za 1500 minut měsíčně, 200 $ ročně bez limitu | iOS, Android |
Jak je to s kvalitou rozpoznávání?
Aplikace zjevně využívají jeden STT kromě Lugh. Jeho schopnost přepsat češtinu mi přišla nejhorší, záhy jsem ho přestal používat. Schopnost rozpoznat český hovor u ostatních aplikací mi přišla velmi podobná s tím, že nejlepší bylo subjektivně se zvukem pracuje filtrováním nejlépe Summie, pak MinutAI a mírně slabší Wave AI. Do jisté míry bylo zajímavé, jak se AI vyrovnala s překřikováním a situací, kdy lidi mluvili najednou. V zásadě vždy to AI nějak přepsala, ale v analýze potlačila, zřejmě pod dojmem toho, že taková pasáž nebyla důležitá a sloužila jen k ujasnění východisek, které byly později znovu řečeny ve větším klidu.
Bylo pro mě překvapující, že když jsem se u aplikace podíval do kompletního přepisu, ten mi nebyl příliš k užitku a prakticky nikdy jsem ho nepoužíval.
Novinka: komplexnější aplikace i pro web cally jako Notta a Fireflies.ai
Velmi slibnou aplikací je Notta. Notta konkuruje spíše Otteru, ale umí pracovat s češtinou - Otter umí jen anglicky, francouzsky a španělsky. Má webové rozhraní, je zaměřená na automatický online přepis hovorů, meetingů a callů i na počítači, umí rovnou překládat do jazyka. Umí dělat sumáře - zápisy ze schůzek. Umí se automaticky připojit na webcall (Zoom, Google Meet, Teams, Webex), když ho máte v kalendáři a dáte jí k tomu souhlas, zápis pak pošle všem/vybraným účastníkům. Umí se propojit s CRM, prostě pokud chcete hodně funkcí, tak to vypadá, že jich umí hodně nabídnout. Verze zdarma je osekaná na tříminutový záznam, zjevně je dělaná jen na vyzkoušení, ne na používání. A navíc aplikace hodně tlačí na roční předplatné, potřebují asi naraisovat peníze, aby měli trochu klidu. Osobně doporučím aplikaci prozkoumat, zda vám na vaše workflow může vyhovovat. Pokud chcete jednoduchý nástroj, který nahraje a sumarizuje schůzku a nic se neřeší, pak sáhněte po předchozích uvedených, pokud to chcete více nastavovat a ladit a nevadí vám roční předplatné, zkuste zde. Čeština jde v pohodě, je i český web.
https://www.fireflies.ai vypadá také zajímavě a podporuje češtinu. Přihlásit se do ní můžete jen přes Google účet s Workspace (tj. firemní účty) nebo přes Microsoft přihlášení, což mě dost odrazuje. Automaticky si načte vaše kalendáře na účtu, bez toho do ní nejde se přihlásit. Pak bude vnucovat trial s vyplněním karty, to nedělejte, po sedmi dnech se účtuje 30 dolarů za měsíc.
Na obrázku je vidět pracovní prostředí v prohlížeči. Nahrál jsem do aplikace kousek mého podcastu, který je namluvený na studiový mikrofon a jak vidíte, ani rozpoznávání hlasu nefunguje tak dobře, jak by se hodilo. Tady se můžete podívat na přepis určený ke sdílení.
Abych řekl pravdu, spolu s Notta jde už o složitější aplikace. Předchozí mobilní appky jsou přímočaré - prostě spustíte appku, zmáčknete tlačítko nahrávání a ono vám to nahraje meeting a udělá sumář, který si můžete ještě poštelovat a říct si, že má být víc o financích, míň o termínech atd. Notta, Otter a Fireflies už jsou náročnější appky vhodné pro časté použití, kdy se vám vyplatí nastudovat jejich funkce a vytěžovat z nich maximum.
Dejme si dva příklady, jak aplikace vypadá po analýze zvuku: WaveAI vs. Summie
A co schopnosti?
Aplikace s podporou češtiny jsou většinou dost jednoduché a umožní jen nahrání schůzky, její analýzu a export dat. Nejkomplexnější je Summie, to dokonce rozpoznává mluvčí a také se můžete expost doptat na to, co ze schůzky vyplývá. Rozpoznání mluvčího vypadá jako stěžejní funkce, ale nepřijde mi to tak podstatné v případě, že ze schůzky potřebujete hlavně zaznamenat závěry. Ty nezáleží na mluvčím. Pokud potřebujete zapisovat argumentaci, stejně budete potřebovat si zápis projít a pro jistotu zkontrolovat a doplnit, kdo je mluvčí kterého argumentu.
Aplikacím jsem mírně přizpůsobil průběh jednání - hlavně ve slovníku. Například v momentě, kdy se dohodneme na dalším postupu, pro jistotu ještě jednou zopakuje, že jsme si tedy dohodli další akční bod nebo úkol a zopakuji jej. Jenže ono to nepomáhá jen AI, ale i lidem na jednání.
Summie nově přidalo možnost záznam ze schůzky udělat v rapperské verzi, musím přiznat, že poprvé mě to docela šokovalo, protože jsem do toho zápisu koukal a nějak jsem nepobíral, o co jde.
Zatím to není tak, že zápis by byl zcela bezúdržbový. A ani není vhodný jako přepis jednání slovo od slova. Ale jako soupis důležitých řečených věcí to začíná fungovat velmi dobře a rozhodně se vyplatí to vyzkoušet.