Metody binaryzacji obrazów
Progowanie i binaryzacja
Binaryzacja jest procesem konwersji obrazów kolorowych lub monochromatycznych (w odcieniach szarości) do obrazu
dwupoziomowego (binarnego). Przeprowadzenie binaryzacji na obrazie znacząco redukuje ilość zawartej w nim informacji.
Najczęściej realizowana jest przez progowanie (
thresholding
), polegające na ustaleniu wartości progowej (
threshold
),
poniżej której piksele obrazu klasyfikowane są jako piksele obiektu, natomiast pozostałe piksele klasyfikowane są jako
piksele tła (nie-obiekt):
gdzie
f
oraz
g
są odpowiednio obrazem oryginalnym i przetworzonym. W zależności od specyfiki obrazu pikselom obiektu/ów
nadaje się wartość minimalną, pikselom tła wartość maksymalną (dla obrazów
8
bitowych, odpowiednio:
0
oraz
255
).
Uogólnieniem metody progowania z pojedynczym progiem (binaryzacja) jest wieloprogowanie (
multithresholding
), w
przypadku którego ustala się większą liczbę progów, pozwalając tym samym na wydzielenie większej liczby klas obiektów w
obrazie. Binaryzacja jest stosowana wszędzie tam, gdzie słuszne jest założenie o istnieniu dwóch klasach obiektów w
obrazie.
Binaryzacja jest powszechnie wykorzystywana jako etap wstępny procesu analizy dokumentów (
document image
understanding, document image analysis
), np. rozpoznawanie tekstu (OCR), pisma odręcznego, cyfryzacja map. Efekt
binaryzacji wpływa na ostateczny wynik złożonego procesu analizy.
Redukcja ilości informacji przeprowadzona na etapie binaryzacji obniża złożoność algorytmów rozpoznawania i tym
samym zmniejsza złożoność czasową całego procesu analizy dokumentu.
Celem binaryzacji jest redukcja informacji zbędnej i pozostawienie informacji istotnej z punktu widzenia dalszego
przetwarzania.
Stanowi najprostszą metodę segmentacji obrazu, czyli podziału obrazu na rozłączne regiony charakteryzujące się
jednorodnością wartości pikseli lub innej branej pod uwagę cechy:
2
Binaryzacja
Idea binaryzacji opiera się na założeniu, że dwa mody histogramu reprezentują dwie rozdzielne klasy: obiekty oraz tło. W
ogólności takie założenie nie musi być prawdziwe.
W zależności od sposobu ustalenia progu metody progowania można dzielić na metody z progiem globalnym, lokalnym oraz
metody hybrydowe.
Progowanie globalne polega na wyznaczeniu na podstawie analizy obrazu jednego progu globalnego.
W przypadku progowania lokalnego, próg ustalany jest dla każdego piksela obrazu niezależnie na podstawie analizy jego
otoczenia (sąsiedztwa, kontekstu).
W ogólności każdą metodę progowania globalnego można zastosować w wersji quasi-lokalnej przez podzielenie obrazu na
podobrazy (bloki o ustalonym rozmiarze) i zastosowanie progowania globalnego do każdego bloku niezależnie. Zaletą
rozwiązania jest prostota (koncepcyjnie). Wadą –większa złożoność czasowa.
progowanie
globalne
T
T
1
T
2
T
4
progowanie
lokalne
T
3
3
Progowanie globalne (1)
Zaletą progowania globalnego jest jego szybkość (operacja
punktowa). Progowanie lokalne jest wolniejsze, ponieważ
wymaga wykonywania obliczeń w otoczeniu każdego piksela
obrazu (operacja kontekstowa). Nie istnieje uniwersalna
metoda binaryzacji dająca dobre rezultaty niezależnie od
specyfiki przetwarzanych dokumentów.
W ogólności metody progowania globalnego nie nadają się
do binaryzacji dokumentów nieodpowiedniej jakości.
Przyczyną błędów binaryzacji mogą być: nierównomierne
oświetlenie dokumentu przed jego pozyskaniem, stosowanie
urządzeń niskiej jakości, zabrudzenia, zagięcia lub
przesączenia atramentu pomiędzy stronami, niejednolite tło
tekstu (np. nadruki firmowe, logo, faktura papieru - tekstura),
niejednolita grubość kreski w przypadku pisma odręcznego,
zbyt mały kontrast, etc.
W ogólności, progowanie globalne daje zadowalające
rezultaty w przypadku gdy obiekty różnych klas zajmują
rozłączne obszary histogramu
a
b
c
d
e
f
g
h
Rys. 1. Przykład progowania globalnego. (a) – obraz oryginalny, (b) – obraz
zbinaryzowany z progiem
T=210
. Obrazy (c), (e) oraz (g) stanowią przykład sytuacji
w której stosowanie progowania globalnego zwykle nie przynosi pożądanych
rezultatów. W tym przypadku problemem jest niejednorodne tło oraz refleksy od
błyszczącej powierzchni.
4
Progowanie globalne (2)
200
a
b
250
200
150
150
100
100
50
50
100
200
300
400
50
100
150
200
250
300
350
250
c
d
250
200
200
150
150
100
100
50
50
50 100 150 200 250 300 350
50
100 150 200 250 300
5
Rys. 1. Progowanie globalne. (a), (c) – przykładowe obrazy cyfrowe, (b), (d) przekrój wartości pikseli w wierszu, odpowiednio 70 oraz 200 (zaznaczone kolorem
czerwonym na oryginalnych obrazach).