Popíšu možnost rozpoznání textu živě při focení, ale i na pořízené fotce pomocí fotoaparátu v iOS 26. Přináším opět pár mých postřehů a zkušeností.
Zjištění obsahu fotografie
Když nám přijde fotka do mailu, Whatsapp či SMS a nevíme, zda je to pouze obrázek či obsahuje i text, tak je nejlepší zjistit obsah fotky pomocí nástrojů AI (Be My AI či Seeing AI). AI nám popíše, zda se jedná o grafiku, co na obrázku je, ale i popíše případný text, to však nemusí být přesný obsah celého textu na snímku. Když zjistíme, že je na foto více textu z popisu, tak využijeme nástroje s OCR – Seeing AI, Envision AI, VD Scan či OneStep Reader Multi.
Focení – detekce textu
iOS 26 detekuje a rozpozná text přímo z fotoaparátu i ze snímků, udělá z něj kopírovatelný, vyhledávatelný a interagovatelný obsah (volání na číslo, otevření adresy na internetu či emailová adresa). Funkce je vhodná pro každodenní uživatele, kteří chtějí rychle zachytit text z letáků, účtů, receptů nebo vizitek bez přepisování.
Rozpoznaný text lze nechat přečíst hlasem VoiceOver - případně zvětšit/zkopírovat pro další zpracování. Funguje i detekce tabulek — iOS 26 přináší lepší nativní rozpoznávání tabulkových struktur (pomůže převést fotografie tabulek do čitelných buněk). Nechala jsem si rozpoznat tabulku řádky a dva sloupce. Krásně byl detekovaný text pochopitelný a logický, že bych nepoznala, že byl původně v, leč jednoduché, tabulce.
iOS 26 disponuje také Live režimem — rozpoznávání přímo při zamíření kamerou (nebo po pořízení snímku) s tlačítkem Detekovat text. Když zamíříme před sebe, je-li tam text, tak opět VO řekne, že je detekován text, šviháním po obrazovce nalezneme tlačítko Detekovat text, na obrazovce se nám objeví detekovaný text, který lze procházet šviháním, lze si jej zkopírovat k dalšímu použití, aniž bychom museli pořizovat fotku. Krásně to funguje např. na monitoru počítače, když bychom nevěděli, co se tam píše. Krásně fotoaparát sejmul celý obsah otevřeného wordovského dokumentu na monitoru počítače.
Velmi praktické jsou i Akce nad rozpoznaným textem — volat telefonní číslo, vyhledat adresu v Mapách, vytvořit událost, překlad v reálném čase. Můžeme vyfotit třeba vizitku, kde najdeme v detekovaném textu všechny kontakty – telefonní číslo, emailovou adresu či domovní adresu. Můžeme tedy rovnou volat, napsat email či navštívit web dané osoby či inzerenta. Na úrovni uživatele: foťák nebo uložená fotografie je analyzována modelem pro rozpoznání znaků. Pokud systém najde text, dá o této skutečnosti vědět a nabídne interakce (kopírovat, přeložit, otevřít). Tohle probíhá buď „naživo“ v pohledu kamery nebo při prohlížení fotek.
Na co pamatovat?
Mějte text dobře osvětlený a ostrý; iOS detekuje i rozmazané části, ale přesnost klesá (iOS 26 nově i upozorní, když je čočka špinavá). Pokud text držíme např. jen před sebou, není na rovném povrchu, tak pak mohou být také chyby v rozpoznaném textu. Objevují se samozřejmě nepřesnosti u velmi špatných předloh, nečitelných rukopisů (je-li velkými a hůlkovými písmeny, tak jde rukopis rozpoznat) nebo extrémně malého písma či špatných světelných podmínek. Pokud bude dokument velmi členitý a graficky náročný, pak rozpoznání také není zcela přesné a bude chybové.
Nastavení funkcí
Otevřeme si Nastavení → Obecné → Jazyk a region → Živý text
a v Fotoaparát → Zobrazit detekovaný text (zobrazení detekovaného textu v pohledu foťáku). V aplikaci Foto se při rozpoznání objeví ikona pro výběr textu (Detekovaný text).
Závěrem
Když pořizujeme fotku, tak VO řekne kromě toho, že je k dispozici QR kód, tak i že je detekován text. Můžeme scénu (např. dveře s informacemi) před sebou vyfotit a na základě této informace nechat rozpoznat obsah fotky pomocí OCR aplikací nebo pomocí AI. Aktuálně v iOS 26 není třeba k rozpoznání textu využívat další aplikace. Protože z pořízené fotky lze rovnou získat informaci o obsahu textu.
Když fotíme, tak slyšíme, že byl detekován text, vyfotíme, jak jsme zvyklí. Ale i během živého focení můžeme s detekovaným textem pracovat, viz. výše. Dále jdeme do galerie fotoaparátu, najdeme fotku. V pravém rohu vyfoceného objektu je tlačítko Detekovat text. Pak již můžeme po fotce švihat prstem a zjišťujeme detekované informace. Jsou-li v textu nějaké kontakty, pak jsou seřazeny do lišty vedle tlačítka Detekovat text (vlevo). Takže na letáku, když je kontakt, není třeba jej pracně vypisovat či si ho pamatovat, tlačítkem Detekovat se zinteraktivní – hodí nás např. na webové stránky či můžeme rovnou dát vytáčet telefonní kontakt, je-li tam adresa, tak můžeme zjistit polohu v mapě či datum, hned přidáme jako událost do kalendáře.
Jsou-li špatné světelné podmínky, špatná kvalita textu či jeho umístění, pak detekce není přesná, což však neplatí pouze pro iOS 26, ale pro veškeré OCR nástroje. Pro rychlé rozpoznání obsahu fotky, scény před námi či popisu na obalu je tato funkce krásně využitelná a praktická pro lidi se zrakovým hendikepem.
Co mi přijde hodně zajímavé je, že do určité míry rozpozná a detekuje i rukopis. Když je písmo čitelné a hůlkové, tak s tím nemá problém. Byly-li tam škrtance a přepisy, tak do jisté míry bylo pochopitelné, co se tam píše. Vzkaz od třídní učitelky psacím písmem, ale krásně napsaným, rozpoznal velmi dobře. Zrovna tak nácvik slov v písance byl přesně čitelný. Takže záleží na kvalitě rukopisu, ale i tohle lze zkusit detekovat.
Komentáře
Okomentovat