OneStep Reader Multi + další OCR aplikace

OCR (Optical Character Recognition, česky optické rozpoznávání znaků) je technologie, která dokáže převést text z fyzických dokumentů nebo obrázků na digitální text, který lze dále editovat, vyhledávat nebo analyzovat. OCR je často využíváno k digitalizaci tištěných dokumentů, převodu textů z fotografií nebo při skenování knih a článků. OCR umožňuje uživatelům, včetně těch, kteří používají asistivní technologie, převádět tištěné texty do podoby, která je čitelná na obrazovce nebo slyšitelná pomocí odečítače obrazovky. Popsané aplikace jsou používány v systému iOS, iPhone 15 Pro.

Na obrázku je monitor se zobrazenou otevřenou knihou. Stejná kniha leží i před monitorem. Kolem je několik lup a mobilní telefon, myš a lampa. Ilustrační obrázek, vytvořen pomocí nástroje AI Bing.

Aplikace, které umožňují skenování tištěné předlohy:

1. VD Scann (dříve Voice Dream Scanner) – v této aplikaci můžeme pořizovat dávkový režim, více snímků, či pouze jeden, můžeme si nechat rozpoznat text na fotce z galerie. Aplikace je pouze na skenování, nemá další funkce.

2. Seeing AI – má více funkcí, má kanál Krátký text (čte text v reálném čase) a Dokument – zde skenujeme předlohu před sebou či vložíme již existující snímek z galerie.

3. Envision AI – tato aplikace mj. má také více funkcí, nabízí dlaždici Krátký text (čte v reálném čase) a Text dokumentu (vyfotíme si sami předlohu), pomocí Knihovny můžeme texty uložit či importovat do aplikace.

4. Seeing Assistant Home – opět víceúčelová aplikace – nabízí funkci Detekovat text, to, co rozpoznala aplikace pak nalezneme v možnosti Recognized texts.

5. OneStep Reader Multi (dříve KNFB Reader) – aplikace přímo určená na rozpoznání textu a práci s ním

Onestep Reader Multi

Je další z aplikací na rozpoznání textu. Dříve byla známá jako KNFB Reader. Cena aplikace v AppStore je 100 USD. Aplikace nabízí možnost používání na více zařízeních pod jedním účtem. To znamená, že zakoupením licence je možné aplikaci nainstalovat například na iPhonu i iPadu a přistupovat k ní pod stejným účtem bez nutnosti platit za každé zařízení zvlášť.

Po otevření aplikace se nám zobrazí náhled fotoaparátem, pod nějž umístíme text připravený k rozpoznání. Okno hledáčku je rozděleno na dvě svislé poloviny:

Levá – vyfotografovat, stisknutím vyfotíme předlohu

Pravá – hlášení zorného pole – když poklepeme, tak VO ohlásí o kolik stupňů a kam je třeba posunout předlohu, aby byla viditelná.

Zařízení při rozpoznávání textu vibruje, když vibruje hodně, je třeba posouvat se zařízením nahoru/dolů, doprava/doleva…Když přestanou vibrace, je možné předlohu vyfotit. Zařízení by to mělo udělat samo, když najde ideální úhel. Člověk s tím musí opravdu jemně manipulovat a stoupat si k předloze, aby se dočkal automatického vyfocení. Většinou, když přestane vibrovat, a vyfotí se předloha, je pěkně čitelná.

Nad hledáčkem – v pravém a levém rohu – se nachází tlačítka:

Levý roh:

Automatický blesk – vypneme/zapneme blesk, pokud v nastavení zvolíme blesk vždy zapnutý, pak toto tlačítko není k dispozici.

Vícestránkový režim – víme-li, že budeme fotit více stran, tak si zde přepneme, popř. vypneme, máme-li zapnuto. Při focení více stran se objeví v horní části hledáčku počet stran, co máme vyfoceno, zda chceme poslední stranu odstranit či nechat vše rozpoznat. Pak začne probíhat rozpoznávání textu.

Pravý roh – navádění nakloněné roviny – přepínač – zapnutý/vypnutý – mobil dává najevo vibracemi, jak je nakloněný oproti předloze, když nevibruje, vyfotíme předlohu (viz. výše).

Vrátit licenci – odebereme aktivaci aplikace ze zařízení. .

Pod hledáčkem dole máme k dispozici 3 tlačítka:

Jazyk rozpoznávaného textu – zde lze zvolit jazyk – angličtina, čeština, francouzština, němčina a španělština – lze tedy rozpoznávat i cizojazyčné texty

Více sloupců – poklepem se změní na jeden sloupec či naopak, opět volíme podle toho, jak text vypadá, víme-li to.

Ruční obrázek – přepínač – přepneme na automatický a naopak – automatický by měl pohybem nad předlohou sám zaměřit a udělat fotku.

Úplně dole na obrazovce se nachází pět panelů:

1. Kamera – panel, kde probíhá focení předlohy

2. Čtení – panel, kde se zobrazí skenovaný text a kde s ním pracujeme

3. Soubory – práce se soubory a složkami

4. Nastavení – nastavení kamery, čtečky aj.

5. Nápověda – začne číst text o aplikaci, ale je anglicky

Kamera – první panel - je panel s hledáčkem fotoaparátu a funkcemi výše popsanými, tímto pořizujeme skeny předloh

Čtení – druhý panel - je panel, ve kterém se nám otevře skenovaný dokument. Přes obrazovku běží text rozpoznaného dokumentu ve velikosti písma, co si vybereme a s daným kontrastním zobrazením – např. žlutý text, modré aktuálně čtené slovo.

Nad rozpoznaným textem máme několik tlačítek:

Uložit soubor – uložíme si aktuální dokument

Přepnout čtečku do PDF zobrazení – dokument se zobrazí tak, jak vypadala předloha, VO i v tomto zobrazení obsah čte.

Čeština Zuzana – tímto tlačítkem změníme hlas čteného textu – hlasy v jazycích viz. výše.

Rychlost – posuvníkem měníme rychlost čtení, v procentech

Jednotka čtení – po řádcích, po větách, po slovech – změna se objeví v liště pod rozpoznaným dokumentem

Sürekli oku – není český název – přepínání mezi průběžným čtením a čtením vlastním tempem, když poklepeme, tak se název tlačítka změní na Kendiliginden oku

Přidat stránku – k aktuálnímu dokumentu můžeme přidat další stránku, a to tím, že ji opět vyfotíme, ona se přidá k té současné rozečtené

Odebrat stránku – odebereme poslední stránku

Göruntu – není popsáno česky, poklepáním se změní zobrazení jako fotografie focené předlohy

Znovu rozpoznat text – klepnutím se tento dokument znovu rozpozná

Pod rozpoznaným (čteným) textem jsou následující tlačítka:

Přejít na stránku – pokud jsme skenovali více stran, tímto tlačítkem a posléze výběrem čísla stránky přejdeme na požadovanou stranu

Dále jsou zde tlačítka – předchozí věta/přehrát či pozastavit/další věta – když zvolíme jednotku čtení slovo či řádek, tak tam bude další slovo/řádek.

Celá obrazovka – aktuální dokument se přepne na režim celé obrazovky

Když otevřeme jakýkoli panel z pěti dole, tak vždy lišta se zbylými panely zůstane tak, abychom se mohli mezi nimi pohybovat a volit ten, který potřebujeme.

Soubory – třetí panel – otevře se aktuální místní složka dokumentů, ty, co byly do KNFB uloženy, procházíme je šviháním, VO čte názvy dokumentů. V horní části obrazovky se nachází pět tlačítek, které nejsou popsány česky:

Sortuj – zde vybereme řazení dokumentů – A-Z či obráceně, od nejnovějšího, od nejstaršího atd. (není česky)

Kamera rulosundan aktar – tímto otevřeme galerii fotoaparátu, ze které můžeme přidat a nechat rozpoznat námi vyfocený či uložený dokument

Přidat složku – můžeme si přidat vlastní složku, kterou si pojmenujeme a budeme si do ní dávat určité dokumenty – např. dle témat

Odzwiez – tlačítko na poklep nereaguje

Upravit – slouží k úpravě složek a souborů – označíme si po jednom či všechny a můžeme s nimi pracovat – objeví se nám nad názvy dokumentů tlačítka – přejmenovat, přemístit, sdílet – lze si poslat např. na mail, Odstranit – smažeme si soubory.

Nad výpisem souborů, názvů dokumentů, máme tlačítko pole Hledání – můžeme vepsat název hledaného dokumentu.

Nad pěti panely v dolní liště jsou dvě tlačítka Místní a Cloud. Místní je úložiště v KNFB aplikaci, v mobilu, Cloud – jsou virtuální úložiště, ať je to úložiště od Googlu (Google Drive), Microsoftu (One Drive) či Dropbox, od Applu iCloud+.

Nastavení – čtvrtý panel – můžeme si zde detailně nastavit kameru, čtečku, seznam souborů, dočteme se zde o aplikaci OneStep Reader Multi.

Nastavení kamery – svítilna, zorné pole režimu na šířku, hlásit orientaci aj.

Nastavení čtečky – hlasitost řeči, rychlost řeči, typ písma, velikost písma, barva písma, barva pozadí, zvýraznění atd.

Nastavení seznamů souborů – spravujeme naše virtuální úložiště

Nápověda – pátý panel – aplikace se přepne do dokumentu nápovědy, VO ho začne číst, je ale v angličtině.

Závěrem shrnutí klíčových funkcí aplikace:

OCR rozpoznávání: Aplikace využívá pokročilé OCR algoritmy, které umožňují rychle převést text z fotografií do formy, kterou lze číst nebo poslouchat.

Podpora vícestránkového skenování: Uživatelé mohou skenovat a číst více stránek v jednom dokumentu.

Možnost exportu textu: Rozpoznaný text lze uložit, sdílet nebo převést do jiných formátů (například PDF).

Asistivní funkce: Aplikace nabízí různé možnosti pro snadné zarovnání fotoaparátu nad textem, což je užitečné pro osoby se zrakovým postižením, a poskytuje hlasovou odezvu během fotografování, aby se usnadnilo správné zaměření na text.

https://apps.apple.com/cz/app/onestep-reader-multi/id1140835211?l=cs

BLINDička aneb Život prakticky nevidomé ženy

Prohledat tento blog