scio-logo-200x61-1-png

Učím s AI

Papír versus digitál – dvojice, která tvoří dichotomii v mnoha oborech, učitelství nevyjímaje. A tak není divu, že otázky, jak tyto dvě formy snadno propojit a přimět je ke vzájemné spolupráci, vyvstávají stále častěji. Výhody papíru pro uživatele tkví v jeho technologické nenáročnosti, “hmatatelnosti” a možnosti využívat při psaní principu “oko-ruka”, který podle psychologů napomáhá lepšímu zapamatování či vyjadřování myšlenek. Navíc příjemně šustí a po vytažení z tiskárny voní inkoustem. Jenže se může snadno roztrhnout. Zmoknout. Dojít. Nebo se ztratit. A vyznat se ve štosech papírů vyžaduje organizovanost a systém.

Proto se ke slovu přihlásila digitalizace. Elektronický dokument nepodléhá povětrnostním vlivům, při jeho hledání stačí většinou jen “zaštrachat” na disku, a jestliže byl vytvořený na počítači, text na něm vždy hravě přečteme nehledě na úhlednost rukopisu jeho autora.

Oříškem však je, když chceme ručně psaný text překlopit do elektronické podoby (tedy fontu), aby se s daty dalo lépe pracovat. Například digitalizovat ručně psané písemky žáků, aby mohl učitel hromadně prezentovat odpovědi ve třídě, sledovat lépe progres žáků nebo písemky pohodlně opravit v tabletu při cestě vlakem. V tomto článku si představíme možnosti, které lze k převodu ručně psaného textu do elektronické podoby využít.

 

1. TEXT – TEXT

OCR technologie

Základním kamenem nástrojů, které dokážou dešifrovat ručně psaný text a přepsat ho tak, jako by byl napsaný na počítači, je takzvaná “OCR” technologie (Optical Character Recognition, neboli technologie k rozpoznávání optických znaků). Ta dokáže z vizuálního zdroje, jako jsou tištěné materiály, ručně psané poznámky nebo obrázky, číst a interpretovat znaky, obdobně jako to děláme my lidé, a následně je převést do digitálního souboru, který člověku umožní dělat úpravy nebo v textu vyhledávat.

Celý proces zahrnuje 3 fáze: Software si nejdříve obraz připraví – zarovná si text, oddělí ho od pozadí, určí textové oblasti a v případě potřeby si poupraví znaky. Následuje samotné rozpoznávání textu, kdy si software spojí tvary znaků a obrázků s naučenými vzorci nebo pravidly. V konečné fázi pak program text ověří tak, že ho porovná se známými pravidly a opraví chyby, aby byl finální text co nejpřesnější.

Pokročilejší nástroje pak využívají ještě o krůček sofistikovanější technologie, známé pod zkratkami ICR (Iintelligent Character Recognition) a OMR (Optical Mark Recognition).

OCR aplikace

Na úvod se hodí říct, že OCR technologie je relativní novinkou – alespoň co se týká programů a aplikací pro širokou veřejnost – a výsledky její práce nebývají zatím zdaleka bohužel uspokojivé. Obecně už aplikace se zabudovanou OCR technologií obstojně zvládají čtení scanu obsahujícího počítačový font, který lze vzhledem k jeho pravidelným a zarovnaným znakům OCR technologie celkem snadno naučit. Mnohem těžší pro ně však je správně (natož zcela bezchybně) rozpoznat text psaný rukou, zvlášť pokud obsahuje diakritiku a pisatel si nedává na čitelnosti záležet. 

Ze všech aplikací, které jsem k účelu převodu rukopisu na digitální text vyzkoušela, mě nejvíc oslovily 3:

  1. Pen to Print. Aplikace dostupná online ve webové i mobilní verzi a dokáže velmi obstojně pracovat i s češtinou.

(test aplikace Pen to Print)

2) Google Lens. Tato populární mobilní aplikace, kterou si lidé většinou spojují spíš s vyhledáváním informací na základě vizuální předlohy, dokáže poměrně kvalitně přepisovat právě i texty. Nejsnazší cestou je zvolit v aplikaci režim “Domácí úkoly” a poté kliknout na “Kopírovat text”. Ten si potom můžete jedním klikem vložit tam, kde chcete s textem dále pracovat. 

3) Aplikace Handwriting to Text Converter od společnosti Apptico, dostupná pro Android. Třebaže v prvním testu, který obnášel moje narychlo ručně psané poznámky, neobstála (výsledkem byla změť různých znaků s občasným náznakem původního obsahu), ve druhém pokusu, ke kterému jsem použila čtyři verze modelové věty a autentické materiály žáka 3. ročníku ZŠ, už přišel s přijatelným výstupem. Takto test dopadl:

(test aplikace Handwriting to Text Converter)

 

Převedený text můžete nakonec vyexportovat do formátu .txt nebo .pdf. Aplikace v bezplatné verzi umožňuje převod 10 stran, poté vás vyzve k platbě předplatného, které činí 249 Kč doživotně. Prémiová verze navíc slibuje vyšší přesnost čtení (99,9 %). 

Další aplikace, které stojí za vyzkoušení

  • OCR technologie v rámci aplikace Adobe Scanner, která je k dispozici pro počítače i mobily. Funkce OCR je dostupná pouze v placené verzi, tu je však před zakoupením vyzkoušet na 7 dní zdarma. Předností této aplikace je, že do oscannované stránky je možné rovnou kreslit – tak můžete například pomocí elektronického pera, které se dá pořídit už za pár korun, do dokumentu vpisovat své poznámky, což může například opravování písemek velmi zpříjemnit a urychlit.
  • Téměř totožné funkce jako produkty Adobe nabízí stránka hipdf.com od společnosti Wondershare. Dokument určený k převodu ale musí být ve formátu pdf.
  • Aplikace Nebo od společnosti MyScript: kvalitu její OCR funkce jsem netestovala, ale obecně mě Nebo zaujala svými funkcemi, mezi které patří různé formy psaní poznámek (klávesnice, stylus/ruka) nebo kreslení ve vrstvách, díky němuž lze následně hýbat s jednotlivými objekty na stránce. Majitelé iPhonů mohou v současné chvíli vyzkoušet verzi Nebo AI Beta, která – jak název napovídá – má v sobě navíc zaimplementovanou umělou technologii, díky níž umí sumarizovat či vysvětlovat. A v plánu je údajně i tvorba kvízů nebo převod fontu na rukopis. Na to si ráda počkám :). 
  • Od již zmiňovaného MyScript stojí za vyzkoušení i jejich OCR funkce v podobě “virtuálního papíru”, kam rukou či stylusem můžete napsat text, který se rovnou v živém čase převádí na font: https://webdemo.myscript.com/views/text/index.html
  • ChatGPT4: Převod textu zvládá i ChatGPT (kvůli nahrání dokumentu, bez kterého se při tomto úkolu neobejdete, se to však týká pouze prémiové verze). Osobně ho do výše uvedené “Top trojky” nezařazuji, protože napoprvé mému požadavku nevyhověl a naváděl mě na instalaci programu Tesseract, což proces převodu zkomplikovalo. Napodruhé však úkol provedl na výbornou:

(test ChatuGPT4)

Obecné tipy k OCR technologiím

  • Nejuspokojivějších výsledků dosáhnete v případě úhledného rukopisu psaného v rovných řádcích. Ideální je tedy používat linkovaný papír a namísto “psace” psát “tiskace”, ideálně hůlkovým písmem. Pište pomalu, aby byla jednotlivá písmena čitelná a uniformní. Papír nijak nemačkejte, nepřehýbejte ani nemuchlejte. Tedy v kostce, čím podobnější bude rukopis digitálnímu fontu, tím snáz ho OCR technologie rozezná (tyto tipy jsou z webu adobe.com). 
  • V případě scanu je potřeba dbát nejen na dobré světlo, ale i na dostatečný kontrast, aby technologie zachytila všechny znaky (u scanovacích aplikací jdou tyto parametry ručně upravovat). 

Je tedy vůbec pro učitele současná OCR technologie použitelná? Ano i ne. Velmi záleží, k čemu potřebujete OCR technologii využívat. Nejlépe funguje u textů bez diakritiky (tedy lépe například na angličtinu a němčinu, případně matematiku, než na češtinu nebo francouzštinu) a tehdy, když je původní text dobře čitelný i pro lidské oko. 

Jestliže vás OCR technologie zajímají, doporučuji tento článek na affinda.com nebo tento článek na webu tonerpartner.cz. V nich najdete tipy na další software a bližší informace o metodách rozpoznávání textu. 

 

2. HLAS – TEXT

Druhou možností, jak bez zdlouhavého přepisu převést text do digitální podoby, je text namluvit. Tento způsob lze využívat jak na mobilu či tabletu, tak v počítači (minimálně Windows 11, které používám já, to umožňují). 

Ve Windows je třeba funkci aktivovat buď tímto postupem: Nastavení – Usnadnění – Interakce – Řeč – Psaní hlasem, nebo klávesovou zkratkou [klávesa Windows] + H. Při psaní delších textů, zvlášť pokud obsahují specifické termíny cizího původu, doporučuji text na obrazovce kontrolovat, neboť v případě, že nadiktujete slovo, které váš počítač nezná, si nějaké prostě domyslí.

Osobně tuto funkci ráda využívám při vypisování poznámek z knih nebo přepisu poznámek narychlo naškrábaných na papír. 

Na mobilu/tabletu se odpovídající funkce nastavuje obdobně. Na Samsungu je to například takto: 1. způsob – Nastavení – Obecná správa – hlasový vstup; 2. způsob – Obecná správa – Nastavení Klávesnice Samsung – Zadávání hlasem – zde zvolte “Zadávání hlasem Google”. Osobně doporučuji 2. způsob, protože v možnostech Hlasového vstupu chybí čeština, mobil by tedy vaši řeč vyhodnocoval podle fonetických pravidel jiného jazyka a výsledkem by byly nesmysly.

Na některých zařízeních bývá tato funkce přímo na klávesnici v podobě klávesy s piktogramem mikrofonu.

Tip: Jestliže hlasem vygenerovaný text má mít reprezentativní formu, diktujte i interpunkci: “Ahoj Jardo – čárka – četla jsem tvou zprávu – tečka – domluvíme se zítra v práci – čárka – dobře – otazník”, a nakonec opravte velká písmena a shodu podmětu s přísudkem, v níž tato metoda ještě pokulhává.

A co vy, už jste někdy OCR technologii zkusili? V čem vám usnadňuje život? Podělte se o své tipy a zkušenosti s kolegy v komentářích!

 

 

Autorka textu: Veronika Löw