Envision AI je pokročilá aplikace pro iOS a Android, která využívá umělou inteligenci k rozpoznávání a popisu vizuálních informací. Je navržena především pro nevidomé a slabozraké uživatele, kterým pomáhá s orientací a přístupem k tištěným i digitálním informacím. I tato aplikace prošla změnami, tak si pojďme popsat co nabízí.
Obecně
Nejprve je třeba aplikaci stáhnout, ať z AppStore či Google Play.
AppStore: Envision AI on the App Store
Google Play: Envision – Aplikace na Google Play
Webové stránky: Envision - Perceive Possibility
Je třeba se přihlásit. Na výběr máme pomocí účtu Apple, Google, emailem aj., vybereme, co nám nejvíce vyhovuje. Dále potvrdíme tlačítka Povolit přístup k fotoaparátu a povolit oznámení od aplikace.
Prostředí aplikace
U dolní lišty najdeme 3 panely:
1. APP – nabízí čtení krátkých textů, skenuje dokumenty či otevírá knihovnu
2. Envision Glasses (brýle)
3. Nastavení – podrobnosti o účtu, podpora či změnit nastavení aplikace
Nad těmito panely jsou pak jejich jednotlivé funkce.
Panel APP – dlaždice s funkcemi, pohybujeme se zde jedním prstem odshora dolů a naopak (VO hlásí upravitelné).
Máme zde dlaždice:
Krátký text, Text dokumentu, Knihovna, Importujte soubor, Čárový kód, Popsat scénu, Prozkoumat, Obecné předměty a Nabídka dalších funkcí
Dlaždice Nabídka dalších funkcí – poklepeme a rozbalí se další menu: Najít člověka, Naučit Envision, Rozpoznání barev a Sken QR. Když chceme z této nabídky zpět, najdeme tlačítko Zpět do hlavní nabídky, dostaneme se o úroveň výše.
Panel APP dlaždice
Krátký text – Envision hned začne číst text, na který zamíříme telefonem. Envision také umí automaticky rozpoznat jazyk. Když chceme začít text číst, poklepeme, když chceme skončit, opět je třeba tlačítko poklepat (dlaždici). Hlasový výstup čte v reálném čase předlohu, zamíříme fotoaparátem např. na monitor počítače, či na konzervu potravin, tento text se neukládá do telefonu, vhodné pro krátký text – např. vizitka či při třídění dokumentů, když chceme orientačně vědět, co je to za dokument.
Text dokumentu – skenování jedno či vícestránkového dokumentu. Aplikace navádí tak, aby byla celá předloha v záběru, toto je vhodné pro delší čtení, lze i přečíst krasopisný text rukou.
Lupa – funkce je k dispozici u dlaždice Krátký text a Text dokumentu. Umožňuje zvětšit úseky textu, které si chceme číst, funkce se aktivuje ikonou v levém horním rohu, lze zde i invertovat barvy pro větší kontrast. Vedle lupy je ještě tlačítko na změnu preferovaného jazyka, předvolby Krátkého textu (jazyk čtení, nastavení skenování textu či detekce rozložení) a jeho nápověda.
Knihovna – můžeme si sem uložit dokumenty, které skenujeme v rámci aplikace k pozdějšímu využití.
Importujte soubor – lze importovat z brýlí, z telefonu, ale také obrázek s textem – lze získat popis obrázku i s textem.
Čárový kód – získáme popis výrobku z jeho čárového kódu, lze se o výrobku dozvědět i dále více informací. Stačí nad výrobkem držet telefon a opatrně a pomalu otáčet, objeví-li se čárový kód, zvukem aplikace upozorní. Dostaneme název výrobku a příp. i další informace např. cenu a kde koupit, je to z Vyhledávání Googlu.
Popsat scénu – aplikace popíše okolí, co se v něm nachází. Envision vyfotí scénu kolem nás, hlasem popíše, co se na scéně nachází, pokud už Envision má naučené tváře přátel, tak i ty zahrne do popisu. Fotky lze uložit do paměti telefonu, fotka je pak k dispozici s popisem, co Envision vytvořil jako alternativní popisek fotografie. Máme na výběr možnost Krátkého popisu (zhruba jedna věta), Podrobný popis (detailní popis všeho, co vidí) a Položit otázku. Fotka scény je pořízena samospouští, stačí držet mobil směrem, co chceme popsat. Vždy se lze v chatu doptat AI na více detailů z pořízeného snímku.
Prozkoumat – hledáme věci kolem sebe, pohybujeme zařízením a aplikace hlásí, co vidí – např. počítačová klávesnice, postel aj. Děje se tak v reálném čase, nic nefotíme pouze pohybujeme okolo sebe telefonem. Opět nezapomínejte vždy dlaždici aktivovat.
Obecné předměty - vyhledá předměty z našeho okolí, je třeba předmět vybrat z předem daného seznamu. Když chceme začít snímat, poklepeme na tlačítko (dlaždici), objeví se nám seznam předmětů – nadpis Oblíbené, kde najdeme např. vypínač, dveře, schody, semafor… a nadpis Všechny objekty – kde jsou např. batoh, míč, kočka, židle aj. Vybereme, co chceme hledat, např. šálek a pohybujeme hledáčkem po okolí, když aplikace předmět najde, upozorní na to vydáváním tónu, čím je rychlejší, míříme na danou hledanou věc (a také VO řekne, co hledá). – např. hledám klávesnici.
Nabídka dalších funkcí (dlaždice):
a) Najít člověka - zjistí, jestli jsou kolem nás lidi. Když člověka pozná, dá zvukové upozornění, takové jako ťuknutí (zvuk).
b) Naučit Envision – tj. naučit tvář, je třeba udělat pět snímků, pak zadáme jeho jméno a aplikace se ho naučí. Aplikace řekne, že je tvář v záběru a že můžeme fotit, tlačítko na vyfocení je v dolní části uprostřed (je bílé, špatně viditelné). Vlevo od tlačítka vyfotit je Restartovat, smažeme to, co jsme vyfotili, vpravo pak kolik zbývá ještě vyfotit snímků či Hotovo. V pravém horním rohu přepínáme fotoaparát na přední/zadní. Když pořídíme pět snímků, dáme Hotovo a pojmenujeme osobu. Když pak využijeme dlaždici Najít člověka, pak nám aplikace řekne jméno osoby. Když chceme aplikaci učit osobu, je třeba poklepat Naučit tvář (je to tlačítko).
c) Rozpoznávání barev – pokud chceme barvy začít rozpoznávat, je třeba tlačítko opět poklepat, když chceme ukončit, tak poklepat znova – Envision má na výběr základní soubor 30 odstínů nebo rozšířený 950 odstínů (pak hlásí např. světlá broskev, modrá obloha či purpurově šedá). Odstíny barev je třeba brát s rezervou, záleží na vzdálenosti snímání a na kvalitě osvětlení. Nejlepší je skenovat barvy na přirozeném slunečním světle.
d) Skenování QR přístupného – skenování QR kódů,
Panel Envision Glasses - brýle – pro připojení brýlí Envision: ENVISION - Equipaid
Panel Nastavení – podrobnosti našeho účtu, získat podporu či nastavit aplikaci.
Práce s dlaždicemi na OCR
Dlaždice Krátký text – Envision hned začne číst text, na který se zamíří. Je třeba vždy aktivovat tu funkci, kterou chceme využít, po skončení práce opět deaktivovat. Envision také umí automaticky rozpoznat jazyk. Může tedy při čtení zaznít více jazyků, je-li v textu i jiný než čeština, Když chceme začít text číst, poklepeme, když chceme skončit, opět je třeba tlačítko poklepat. Když aplikace text zaměří, tak hned čte vše, co vidí. Když chceme začít číst něco jiného, je lepší vždy funkci zapnout a vypnout, začít jakoby znova. Vhodné třeba na rozpoznání produktů v kuchyni – koření aj.
Dlaždice Text dokumentu - Envision navede, jak dokument vyfotit, aby byl celý, hlásí, že okraje jsou viditelné, pak automaticky text zachytí, říká, držte dokument bez pohybu. Pro aktivaci této funkce je třeba opět tlačítko (dlaždici) poklepat, na ukončení taktéž. Lze vyfotit i tlačítkem ve spodní části obrazovky. Aplikace navádí tak, aby byla celá předloha v záběru, toto je vhodné pro delší čtení. Na obrazovce, kde vidíme naši předlohu náhledem fotoaparátu, můžeme také volit – skenování jedné stránky či dávkové skenování (více stran) – upravitelné – pohyb jedním prstem odshora dolů a naopak. V horní liště pak ještě můžeme vybrat Preferovaný jazyk a Text dokumentu předvolby a nápověda. (stejné jako u dlaždice Krátký text).
Když si necháme předlohu rozpoznat, pak přes obrazovku máme rozpoznaný text, v něm se můžeme pohybovat pomocí švihání.
Při dolní liště máme pět tlačítek:
1. Zeptejte se Envision – dotaz na AI ohledně pořízené fotky na něco více konkrétního či detaily. Je to chat s AI. Lze zde rovnou fotku s popisem si uložit.
2. Možnosti exportu – Uložit do knihovny, Uložit jako soubor PDF, Uložit jako soubor TXT, Zkopírovat do schránky a Sdílet text přes…Můžeme si tedy zvolit možnost, jak si text uložíme k další práci s ním.
3. Přehrát (přehraje rozpoznaný text) – hlasem se nám přehraje to, co jsme si nechali rozpoznat.
4. Přečíst od začátku stránky – přeruší probíhající čtení a začne od začátku
5. Přeložit – možnosti překladu do cizích jazyků, u horní lišty vidíme možnost zjištěný jazyk (čeština) a můžeme si zvolit jazyk překladu. I u překladu máme v dolní liště oněch pět tlačítek, tak si můžeme nechat přeložený text přečíst, uložit si ho či nechat přeložit do dalšího z jazyků.
Pravý horní roh je tlačítko Nastavení čtečky – jsou zde možnosti nastavení automatické rozpoznání jazyka, detekce rozložení (sloupců ve správném pořadí), velikost textu (toho rozpoznaného), řeč, hlasy, jazyk čtení, rychlost řeči aj.
Dlaždice Knihovna – sem si můžeme ukládat naše oskenované dokumenty (lokálně, po smazání aplikace se též smažou) či importovat dokumenty z telefonu (soubory či galerie fotoaparátu). Lze importovat i z brýlí, když je člověk vlastní.
Výhody aplikace Envision AI:
• Přístupnost – Plná kompatibilita s odečítači obrazovky, jako je VoiceOver na iOS či TalkBack v telefonech s OS Android.
• Multijazyčná podpora – Rozpoznává a čte text ve více než 60 jazycích.
• Rychlost a přesnost – Díky pokročilé AI poskytuje přesné výsledky ve velmi krátkém čase.
• Offline funkce – Některé funkce (např. čtení textu) lze využívat i bez připojení k internetu.
• Integrace s chytrými brýlemi – Kompatibilní s Envision Glasses pro hands-free použití.
Pozn.: Článek sepisován při použití iPhone 15 Pro a iOS 18.3.1
Komentáře
Okomentovat