25. Jak pracuje skener a optické rozpoznávání

Skenery jsou očima vašeho osobního počítače. Umožňují mu převést kresbu nebo fotografii do kódu, který mohou použít grafické, ediční programy a ukázat ji na obrazovce, vytisknout na grafické tiskárně nebo stránku s textem převést do editovatelného textu.

Tři základní typy skenerů se v zásadě liší způsobem, jakým se stránka s předlohou a snímací hlava, která předlohu čte, vzájemně pohybují. Ve skeneru s posuvem papíru je papír pod snímací hlavou posouván mechanickými válečky. U plochých skenerů se stránka za skleněným oknem nepohybuje a pohybuje se snímací hlava, podobně jako pracují kopírky. Ruční skener držíme v ruce a snímací hlavou pohybujeme sami.

Každá z uvedených metod má svoje výhody a nevýhody. Plochý skener vyžaduje řadu zrcadel pro zachycení obsahu předlohy, která se při pohybu snímací hlavy neustále snímá a zaměřuje do čoček přivádějících na řadu senzorů. Žádné zrcadlo není dokonalé, proto při každém odrazu dojde k určitému zkreslení. Výhodou plochých skenerů je, že mohou snímat rozměrné nebo tlusté dokumenty, jako třeba knihu. Ve skeneru s posuvem papíru je předloha sejmuta přesněji, snímání je však omezeno na jednotlivé listy předepsaného formátu. Ruční skener je kompromisem. Může snímat stránku v knize, ale snímací hlava často není tak široká jako hlava v plochém skeneru nebo ve skeneru s posuvem papíru. Ruční skener, který je při snímání závislý na pevném a přesném vedení vaší rukou, je obecně levnější, protože nevyžaduje mechanismus pro pohyb snímací hlavy nebo papíru.

Důvtip skeneru spočívá v jeho schopnosti převést neomezený rozsah analogových napěťových úrovní do číselných hodnot. Některé skenery rozlišují pouze černou a bílou a jsou užitečné pouze pro snímání textu. Přesnější modely dokáží rozlišovat stupně šedi. Barevné skenery používají pro zjištění barev v odraženém světle červené, modré a zelené filtry. Bez ohledu na citlivost skeneru na stupně šedi nebo na to, zda posouvají papír nebo snímací hlavy, je princip činnosti všech skenerů v podstatě jednoduchý a podobný.

Podíváme se na dva představitele technologií, o kterých jsem se zmínil - plochý skener a ruční skener pro odstíny šedi. Rovněž se budeme věnovat jednomu z nedůležitějších důvodů pro snímání dokumentů, kterým je převod jejich obsahu do editovatelného textu pomoci software pro rozpoznávání znaků.

Plochý skener
1. Zdroj světla osvětluje list papíru umístěný lícem dolů na skleněné okno nad snímacím mechanismem. Prázdná místa na papíře odrážejí více světla než černá nebo barevná písmena a obrázky.
2. Motor pohybuje snímací hlavou podél stránky. Snímací hlava při svém pohybu zachycuje světlo odražené z jednotlivých oblastí stránky. Z každého čtverečního palce sejme odraz 90 000 krát.
3. Světlo přicházející ze stránky je odráženo systémem zrcadel, která se musí neustále natáčet tak, aby se světlo z nich dostávalo do čoček.
4. Čočky soustředí paprsek na světlocitlivé diody, které převádějí intenzitu dopadajícího světla na elektrický proud. Čím více světla se odráží, tím větší je proud.
5. Analogově-čislicový převodník (ADC) ukládá každý přečtený napěťový impuls jako digitální bod, představující černou nebo bílou oblast na řádku, který obsahuje 300 bodů na palci. Dokonalejší skenery umí napěťové impulsy převádět do stupňů šedi. Pokud je ve skeneru založen barevný obrázek, snímací hlava projíždí pod předlohou třikrát a při každém průchodu je předloha postupně ozářena světlem přes červený, zelený a modrý filtr.
6. Číselná informace se odesílá programu v počítači, jenž data ukládá ve formátu, se kterým umějí pracovat grafické programy nebo programy pro optické rozpoznávání znaků.
Ruční skener
1. Stisknete-li snímací tlačítko na typickém ručním skeneru, rozsvítí se světelná dioda (LED) a osvětlí předlohu pod skenerem. Obrácené, pod úhlem skloněné zrcadlo, přímo ve výřezu skeneru odráží obraz do čoček v zadní části tělesa skeneru.
2. Čočky zaostří jediný řádek předlohy do tzv. charge coupled device (CCD, česky - nábojově vázaný prvek), který je částí určenou pro zjišťování jemných světelných rozdílů. CCD obsahuje řadu světelných čidel. Jak se světlo dotkne těchto čidel, každé z nich zaregistruje množství světla jako úroveň napětí, které odpovídá bílé, černé, šedé nebo odstínu barvy.
3. Napětí generované CCD jsou odesílána do specializovaného analogového čipu na provedení gama korekce. To je proces, který zdůrazní černé tóny v předloze, takže lidské oko, které je citlivější na tmavé tóny než na světlé, to bude mít při prohlížení obrázku jednodušší. U některých skenerů je gama korekce prováděna softwarově.
4. Jeden řádek předlohy prochází analogově-číslicovým převodníkem (ADC). U skenerů rozlišujících odstíny šedi převodník zapíše každý bod do 8 bitů, čímž dochází k převodu na 256 úrovní šedi v cílovém digitalizovaném obraze. A/D převodník u skenerů, které snímají jen černou nebo bílou, a zaznamenává barvu každého bodu pomocí jediného bitu. Jednička je černá barva, nula je bílá barva.
5. Pohnete-li rukou se skenerem, pohne se rovněž váleček z tvrdé gumy (jehož hlavním úkolem je udržet pohybující se skener v rovině), který dále uvede do pohybu řadu soukolí otáčejících kotoučem s průzory.
6. Kotouč se točí, světlo prochází jeho průzory a na druhé straně kotouče je detekováno miniaturním světelným čidlem. Světlo dopadající na čidlo sepne spínač, který do A/D převodníku odešle signál. Signál informuje převodník, aby odeslal řádek bitů, vytvořených převodníkem do počítače. Převodník pak odeslaná dat vymaže a je připraven přijmout novou posloupnost napěťových pulsů z dalšího řádku předlohy.
Optické rozpoznávání znaků
1. Po přečtení obrazu nějakého dokumentu, skener převede tmavé části předlohy (text a kresbu) do tvaru, kterému říkáme bitová mapa, což je matice černých (1) nebo bílých (0) bodů. Body jsou větší než detaily většiny textu, proto tento proces degeneruje ostré okraje znaků, asi tak jako fax rozmaže ostré znaky. Tato degradace vytváří většinu problémů vznikajících při optickém rozpoznáváni znaků (OCR, optical character recognition).
2. Software OCR načte bitové mapy vytvořené skenerem a provede průměrování zón nul a jedniček na stránce, čímž ve skutečnosti mapuje bílá místa na stránce. To umožní softwaru zjistit bloky odstavců, sloupce, řádky s nadpisy a obrázky. Bílá místa mezi řádky textu uvnitř bloků definují základnu každého řádku, což je důležitý detail pro rozpoznávání znaků v textu.
3. Při svém prvním průchodu při převodu obrazu na text se software pokouší o srovnání každého znaku bod po bodu se vzory znaků, které má uloženy v paměti. Vzory obsahují kompletní typy písma - číslice, interpunkci a další znaky - od takových obvyklých typů písma jako jsou 12 bodový Courier a sada znaků IBM Selectric. Tato použitá technika vyžaduje velmi těsnou shodu, a proto musí být přesně definovány takové atributy písma, jako je kurzíva nebo tučné písmo. Skenery s nízkou kvalitou mohou způsobit zadrhování při srovnávání matic.
4. Znaky, které zůstanou nerozpoznány jsou podrobeny intenzívnějšímu a časově náročnějšímu procesu, kterému říkáme extrakce rysů. Software vypočítává x výšku textu - výšku malého písmene x - a analyzuje každou kombinaci přímých čar, křivek a uzavřených ploch (jako jsou třeba v o nebo v b) znaku. Program OCR ví, že například znak s ohnutým tahem pod základní čarou a uzavřenou plochou nad je nejvíce podobný znaku g. Jelikož si software z každého nového znaku, na který narazí, vytváří pracovní abecedu, rychlost rozpoznávání se zvyšuje.
5. Pokud tyto dva procesy nedešifrují všechny znaky, přistupuje software OCR ke zbývajícím “hieroglyfům” dvěma způsoby. Některé programy OCR nahradí nepoznaný znak nějakým nápadným znakem jako je ~, # nebo @ a ukončí činnost. Vy potom musíte tyto znaky v textu vyhledat a ručně opravit. Některé programy OCR mohou také na obrazovce ukázat zvětšeninu bitové mapy a požádat vás o stisknutí klávesy příslušející zobrazenému znaku.
6. Některé jiné programy OCR ještě vyvolávají zvláštní tester pravopisu, který se snaží nalézt obvyklé chyby a možné varianty slov, která obsahují nepoznané znaky. Například pro OCR programy vypadá číslice 1 a písmeno l velmi podobně, zrovna tak 5 a S nebo cl a d. Takové slovo jako je downturn může být chápáno jako clownturn. Tester gramatiky je schopen rozpoznat některé typické chyby OCR a opravit je.
7. Většina programů OCR vám dá na vybranou, zda chcete dokument uložit jako ASCII soubor nebo jako soubor používaný nejpopulárnějšími textovými editory nebo tabulkovými kalkulátory.