OCR (Optical Character Recognition, česky optické rozpoznávání znaků) je technologie, která dokáže převést text z fyzických dokumentů nebo obrázků na digitální text, který lze dále editovat, vyhledávat nebo analyzovat. OCR je často využíváno k digitalizaci tištěných dokumentů, převodu textů z fotografií nebo při skenování knih a článků. OCR umožňuje uživatelům, včetně těch, kteří používají asistivní technologie, převádět tištěné texty do podoby, která je čitelná na obrazovce nebo slyšitelná pomocí odečítače obrazovky. Popsané aplikace jsou používány v systému iOS, iPhone 15 Pro.
Aplikace, které umožňují skenování tištěné předlohy:
1. VD Scann (dříve Voice Dream Scanner) – v této aplikaci můžeme pořizovat dávkový režim, více snímků, či pouze jeden, můžeme si nechat rozpoznat text na fotce z galerie. Aplikace je pouze na skenování, nemá další funkce.
2. Seeing AI – má více funkcí, má kanál Krátký text (čte text v reálném čase) a Dokument – zde skenujeme předlohu před sebou či vložíme již existující snímek z galerie.
3. Envision AI – tato aplikace mj. má také více funkcí, nabízí dlaždici Krátký text (čte v reálném čase) a Text dokumentu (vyfotíme si sami předlohu), pomocí Knihovny můžeme texty uložit či importovat do aplikace.
4. Seeing Assistant Home – opět víceúčelová aplikace – nabízí funkci Detekovat text, to, co rozpoznala aplikace pak nalezneme v možnosti Recognized texts.
5. OneStep Reader Multi (dříve KNFB Reader) – aplikace přímo určená na rozpoznání textu a práci s ním
Onestep Reader Multi
Je další z aplikací na rozpoznání textu. Dříve byla známá jako KNFB Reader. Cena aplikace v AppStore je 100 USD. Aplikace nabízí možnost používání na více zařízeních pod jedním účtem. To znamená, že zakoupením licence je možné aplikaci nainstalovat například na iPhonu i iPadu a přistupovat k ní pod stejným účtem bez nutnosti platit za každé zařízení zvlášť.
Po otevření aplikace se nám zobrazí náhled fotoaparátem, pod nějž umístíme text připravený k rozpoznání. Okno hledáčku je rozděleno na dvě svislé poloviny:
Levá – vyfotografovat, stisknutím vyfotíme předlohu
Pravá – hlášení zorného pole – když poklepeme, tak VO ohlásí o kolik stupňů a kam je třeba posunout předlohu, aby byla viditelná.
Zařízení při rozpoznávání textu vibruje, když vibruje hodně, je třeba posouvat se zařízením nahoru/dolů, doprava/doleva…Když přestanou vibrace, je možné předlohu vyfotit. Zařízení by to mělo udělat samo, když najde ideální úhel. Člověk s tím musí opravdu jemně manipulovat a stoupat si k předloze, aby se dočkal automatického vyfocení. Většinou, když přestane vibrovat, a vyfotí se předloha, je pěkně čitelná.
Nad hledáčkem – v pravém a levém rohu – se nachází tlačítka:
Levý roh:
Automatický blesk – vypneme/zapneme blesk, pokud v nastavení zvolíme blesk vždy zapnutý, pak toto tlačítko není k dispozici.
Vícestránkový režim – víme-li, že budeme fotit více stran, tak si zde přepneme, popř. vypneme, máme-li zapnuto. Při focení více stran se objeví v horní části hledáčku počet stran, co máme vyfoceno, zda chceme poslední stranu odstranit či nechat vše rozpoznat. Pak začne probíhat rozpoznávání textu.
Pravý roh – navádění nakloněné roviny – přepínač – zapnutý/vypnutý – mobil dává najevo vibracemi, jak je nakloněný oproti předloze, když nevibruje, vyfotíme předlohu (viz. výše).
Vrátit licenci – odebereme aktivaci aplikace ze zařízení. .
Pod hledáčkem dole máme k dispozici 3 tlačítka:
Jazyk rozpoznávaného textu – zde lze zvolit jazyk – angličtina, čeština, francouzština, němčina a španělština – lze tedy rozpoznávat i cizojazyčné texty
Více sloupců – poklepem se změní na jeden sloupec či naopak, opět volíme podle toho, jak text vypadá, víme-li to.
Ruční obrázek – přepínač – přepneme na automatický a naopak – automatický by měl pohybem nad předlohou sám zaměřit a udělat fotku.
Úplně dole na obrazovce se nachází pět panelů:
1. Kamera – panel, kde probíhá focení předlohy
2. Čtení – panel, kde se zobrazí skenovaný text a kde s ním pracujeme
3. Soubory – práce se soubory a složkami
4. Nastavení – nastavení kamery, čtečky aj.
5. Nápověda – začne číst text o aplikaci, ale je anglicky
Kamera – první panel - je panel s hledáčkem fotoaparátu a funkcemi výše popsanými, tímto pořizujeme skeny předloh
Čtení – druhý panel - je panel, ve kterém se nám otevře skenovaný dokument. Přes obrazovku běží text rozpoznaného dokumentu ve velikosti písma, co si vybereme a s daným kontrastním zobrazením – např. žlutý text, modré aktuálně čtené slovo.
Nad rozpoznaným textem máme několik tlačítek:
Uložit soubor – uložíme si aktuální dokument
Přepnout čtečku do PDF zobrazení – dokument se zobrazí tak, jak vypadala předloha, VO i v tomto zobrazení obsah čte.
Čeština Zuzana – tímto tlačítkem změníme hlas čteného textu – hlasy v jazycích viz. výše.
Rychlost – posuvníkem měníme rychlost čtení, v procentech
Jednotka čtení – po řádcích, po větách, po slovech – změna se objeví v liště pod rozpoznaným dokumentem
Sürekli oku – není český název – přepínání mezi průběžným čtením a čtením vlastním tempem, když poklepeme, tak se název tlačítka změní na Kendiliginden oku
Přidat stránku – k aktuálnímu dokumentu můžeme přidat další stránku, a to tím, že ji opět vyfotíme, ona se přidá k té současné rozečtené
Odebrat stránku – odebereme poslední stránku
Göruntu – není popsáno česky, poklepáním se změní zobrazení jako fotografie focené předlohy
Znovu rozpoznat text – klepnutím se tento dokument znovu rozpozná
Pod rozpoznaným (čteným) textem jsou následující tlačítka:
Přejít na stránku – pokud jsme skenovali více stran, tímto tlačítkem a posléze výběrem čísla stránky přejdeme na požadovanou stranu
Dále jsou zde tlačítka – předchozí věta/přehrát či pozastavit/další věta – když zvolíme jednotku čtení slovo či řádek, tak tam bude další slovo/řádek.
Celá obrazovka – aktuální dokument se přepne na režim celé obrazovky
Když otevřeme jakýkoli panel z pěti dole, tak vždy lišta se zbylými panely zůstane tak, abychom se mohli mezi nimi pohybovat a volit ten, který potřebujeme.
Soubory – třetí panel – otevře se aktuální místní složka dokumentů, ty, co byly do KNFB uloženy, procházíme je šviháním, VO čte názvy dokumentů. V horní části obrazovky se nachází pět tlačítek, které nejsou popsány česky:
Sortuj – zde vybereme řazení dokumentů – A-Z či obráceně, od nejnovějšího, od nejstaršího atd. (není česky)
Kamera rulosundan aktar – tímto otevřeme galerii fotoaparátu, ze které můžeme přidat a nechat rozpoznat námi vyfocený či uložený dokument
Přidat složku – můžeme si přidat vlastní složku, kterou si pojmenujeme a budeme si do ní dávat určité dokumenty – např. dle témat
Odzwiez – tlačítko na poklep nereaguje
Upravit – slouží k úpravě složek a souborů – označíme si po jednom či všechny a můžeme s nimi pracovat – objeví se nám nad názvy dokumentů tlačítka – přejmenovat, přemístit, sdílet – lze si poslat např. na mail, Odstranit – smažeme si soubory.
Nad výpisem souborů, názvů dokumentů, máme tlačítko pole Hledání – můžeme vepsat název hledaného dokumentu.
Nad pěti panely v dolní liště jsou dvě tlačítka Místní a Cloud. Místní je úložiště v KNFB aplikaci, v mobilu, Cloud – jsou virtuální úložiště, ať je to úložiště od Googlu (Google Drive), Microsoftu (One Drive) či Dropbox, od Applu iCloud+.
Nastavení – čtvrtý panel – můžeme si zde detailně nastavit kameru, čtečku, seznam souborů, dočteme se zde o aplikaci OneStep Reader Multi.
Nastavení kamery – svítilna, zorné pole režimu na šířku, hlásit orientaci aj.
Nastavení čtečky – hlasitost řeči, rychlost řeči, typ písma, velikost písma, barva písma, barva pozadí, zvýraznění atd.
Nastavení seznamů souborů – spravujeme naše virtuální úložiště
Nápověda – pátý panel – aplikace se přepne do dokumentu nápovědy, VO ho začne číst, je ale v angličtině.
Závěrem shrnutí klíčových funkcí aplikace:
OCR rozpoznávání: Aplikace využívá pokročilé OCR algoritmy, které umožňují rychle převést text z fotografií do formy, kterou lze číst nebo poslouchat.
Podpora vícestránkového skenování: Uživatelé mohou skenovat a číst více stránek v jednom dokumentu.
Možnost exportu textu: Rozpoznaný text lze uložit, sdílet nebo převést do jiných formátů (například PDF).
Asistivní funkce: Aplikace nabízí různé možnosti pro snadné zarovnání fotoaparátu nad textem, což je užitečné pro osoby se zrakovým postižením, a poskytuje hlasovou odezvu během fotografování, aby se usnadnilo správné zaměření na text.
https://apps.apple.com/cz/app/onestep-reader-multi/id1140835211?l=cs
Komentáře
Okomentovat