logo-new-font-tm

Vygenerujte si video včetně textu i hlasu

AI není jen chatbot. Díky tomuto tipu si vytvoříte video doplněné vaším nebo klidně cizím hlasem.


Umělá inteligence není jen chatbot

Když se řekne “AI” většina z nás si vybaví chatboty jako je třeba ChatGPT nebo další, o kterých zde také mluvíme. 

Je tu ale spousta dalších nástrojů, které třeba negenerují texty, nicméně využívají AI k něčemu jinému a leccos z toho by možná šlo využít také ve škole. 

Dnes jsem si pro vás vybral ukázku toho, jak lze propojit tvorbu textů s tvorbou hlasu a videa. 

Nejdříve se prosím podívejte na toto video:

Co tomu říkáte? Líbí? Nelíbí? 

Dobře, je to zcela průměrné až podprůměrné video. V místech, kde by měla být bábovka se zobrazuje úplně jiný zákusek. Za střihy by mi asi profesionální střihač také jednu “střihnul”. Hlas se místy zasekává, občas polyká slabiky a do televize by ho asi nevzali. 

Obsah nenadchne, nezarmoutí. 

A proč s tím na webu o AI? Tušíte správně. Vše vytvořila výhradně umělá inteligence. Za méně než 10 minut vygenerovala na základě stručného zadání jak samotný text, tak i mluvené slovo. Ačkoli hlas zní jako můj vlastní, ve skutečnosti jde pouze o klon mých hlasových vzorků vytvořený pomocí syntetizátoru. Nikdo z mých známých nepoznal, že to nejsem já. Stejně tak video není ničím jiným než sledem obrázků automaticky seskládaných umělou inteligencí tak, aby odpovídal textu. Ukázka demonstruje schopnosti moderních algoritmů vytvářet na stručný pokyn kompletní mediální obsah.

Jak se vám to líbí teď? 

Pojďme si vyzkoušet vytvořit podobný obsah.

Proč zrovna téma bábovky? Už nějakou dobu přednáším americkým studentům o kultuře střední Evropy. A právě na příkladu obyčejné bábovky jim vysvětluji její specifickou atmosféru. Nedávno jsme si domlouvali další přednášku, a tak jsem si na ten nápad zase vzpomněl. Rozhodl jsem se vyzkoušet, jak by šel podobný obsah vytvořit pomocí umělé inteligence. Do aplikace jsem tedy zadal tento prompt:

c9d434_3813b00bfa7f4e4e94fc87179188f37fmv2-5183282

A během několika vteřin mi chatbot napsal esej, kterou jste slyšeli ve videu. Nijak jsem do ni nezasahoval a přešel hned k dalšímu kroku: namluvení audiostopy svým hlasem. 


K tomu jsem použil aplikaci ElevenLabs – Speech Synthesis.

c9d434_5045f1acdd99441d8a0f27f2d58cba12mv2-8869100

Přihlášení je jednoduché (ideálně pomocí gmailového účtu, který používáte pouze na zkoušení aplikací). 

Základní verze je zdarma, bohužel ale neumožňuje klonování hlasu. Proto Vám nyní ukáži postup v placené verzi, která je té zdarma velmi podobná. Chápu, že si jako učitelé možná nemůžete dovolit podobné aplikace kupovat. Ukazujeme zde placené verze především proto, že funkce, které dnes poskytuje jedna placená aplikace, budou v budoucnu pravděpodobně běžnou součástí mnoha aplikací, často i těch zdarma dostupných, alespoň pro školy.

1. na horní liště klikněte nejdříve na VoiceLab

2. vyberte Add Generative or Cloned Voice

3. z nabídky vyberte Instant Voice Cloning:

c9d434_92bb380baa434bf6a52018971a6027d4mv2-5877101
c9d434_727500a775a44fa9a588e8f56bd56203mv2-5762206
c9d434_177fce6f01c643b09a9df7a39318a38bmv2-7818609

Otevře se vám vyskakovací okno, které umožňuje nahrát zdroj klonovaného hlasu a pojmenovat si ho. 

c9d434_b8b9e992b012484aa957d2821ba7b49amv2-8033178

Budete potřebovat čistou nahrávku svého hlasu bez okolních ruchů. Ideální délka je okolo minuty. 

Poté stačí pouze odkliknout Add Voice a váš nový hlas je připraven k použití. 

Poté se vraťte v nabídce na horní liště na Speech Synthesis. 

​Zde si na záložce Settings vyberte svůj hlas a do pole Text napište, co chcete, aby hlas přečetl:

c9d434_54242f0409c3420e8762c11b6c57c7e8mv2-3831355
c9d434_48151850159649db86de91d6db496466mv2-9275331

Tip: Zkuste si zadat také text v cizím jazyce. Váš hlas pak bezvadně přečte cokoli v angličtině, francouzštině či mnoha dalších jazycích. 

Pak už jen stačí kliknout na Generate a nahrávka je na světě! 

Do počítače nahrávku dostanete kliknutím na symbol stažení vpravo dole:

c9d434_06d0c1ef3c514c1f87f53e6d42b27e15mv2-1307311

Nahrávku si uložte a přesuneme se k videu. 
 

K tomu jsem použil aplikaci Pictory.AI. K vytvoření videa o bábovce mi stačilo využít bezplatnou zkušební verzi, která umožňuje vytvořit 3 podobná videa zdarma. 

Z nabídky programu jsem si vybral Create Project a dostal se sem:

c9d434_45a7acdcd45a4b9babb5205412ebb9efmv2-3454697

Mým cílem bylo převést text na video, v daném případě esej o bábovce, kterou mi vygeneroval ChatGTP do obrazového doprovodu. Vybral jsem proto Script to Video. 

Otevřel se mi jednoduchý editor, do kterého jsem nakopíroval text z ChatGTP:

c9d434_814a6579c13348b2846de2d8909c114fmv2-2793522

Poté jsem klikl na Proceed (pokračovat) a vybral si jednu z mnoha šablon (templates), které mi aplikace nabízí:

c9d434_33405d63e37447928713974a186379eemv2-3600224

Aplikace pak sama “můj” text rozdělí do scén a ke každé scéně přiřadí vizuální doprovod:

c9d434_0e8ac3b7cc24455689edb47d0f34fd15mv2-1697131

Tip: aplikace generuje vizuální doprovod na základě textového vstupu. Protože mám za to, že angličtina zatím může produkovat lepší výsledky, text jsem si pomocí překladače DeepL převedl do angličtiny a pracoval jen s anglickou verzi. Nicméně Pictory by to určitě zvládl i česky. 

Pokud se vám některý vizuální doprovod scény nelíbí, můžete si ho snadno vyměnit za jiný v sekci Visuals

c9d434_501513e9d8ae4bb19d74be443f9c5bd8mv2-5563749

A jak tam dostat svůj hlas? Jednoduše. Klikněte na mikrofonek pod obrazem

c9d434_470aa2c2077642ac9631d035761dfd89mv2-3113787

A zobrazí se vám pole, kam můžete jednoduše nahrát svůj vygenerovaný komentář z počítače:

c9d434_1011f18c70c14717957f770dbb806950mv2-5593942

Video si můžete prohlédnout stisknutím tlačítka Preview vpravo nahoře, a pokud se vám líbí, tak ho rovnou stáhnout do počítače pomocí Download:

c9d434_492528a55feb459386579c72a20d580amv2-3733009

A jak to využít ve škole? Přiznám se, že zatím nevím. 

Napadla mě situace, kdy by se mi to bývalo hodilo před několika lety. Věnovali jsme se zrovna v dějepise pravěku a starověku, neolitické revoluci a vynálezu peněz. Četli jsme si z Harariho a společně přemýšleli o tom, jestli objev zemědělství byl pro člověka spíše požehnáním nebo prokletím nebo jaký by byl svět bez peněz. Výstupem měla být esej. Žáci měli na výběr několik možností, od té obvyklé argumentační eseje přes divadelní ztvárnění až po video esej. Inspirovala nás k tomu díly Godfreye Reggio, který dokázal myšlenku a názor vyjádřit zcela beze slov jen promyšleným účinem kombinujícím obraz a zvuk. 

Někteří žáci si vybrali videoesej, kterou dost pracně stříhali po nocích doma v Movie Makeru či podobných nástrojích. 

Výsledkem byla třeba práce této žačky osmé třídy, o které jsme pak společně diskutovali a rozebírali jednotlivé scény. 

Třeba ji by zrovna podobné aplikace pomohly se kreativně vyjádřit. 

Co myslíte vy, k čemu by se daly programy typu Pictory nebo Speech Synthesis využít?


Komentáře

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *