Co to jest i do czego służy reCaptcha ? Definicja
2022-05-14
reCaptcha – rozwiązanie informatyczne, za pomocą którego rozproszona aktywność internautów jest wykorzystywana do pomocy w identyfikacji fragmentów zeskanowanego tekstu, które nie mogą być odczytane przez oprogramowanie OCR.
Łączy ochronę stron internetowych za pomocą CAPTCHA z użyteczną pracą użytkowników sieci polegającą na skanowaniu tekstu. Ze względu na masowe wykorzystywanie botów do rozprzestrzeniania spamu, coraz więcej stron internetowych zabezpiecza swoje witryny za pomocą CAPTCHA. Użytkownik musi rozpoznać na obrazie celowo zniekształcony tekst – w ten sposób udowadnia, że jest żywym człowiekiem, a nie maszyną. Zadania CAPTCHA (pary składające się z obrazka i ukrytego słowa powyżej) są automatycznie generowane przez odpowiednie programy. Tymczasem programy OCR mają bardzo podobne zadanie identyfikacji nieczytelnego tekstu. Podczas skanowania zeskanowanego tekstu (np. książek) często pojawiają się nieczytelne fragmenty, których oprogramowanie OCR nie daje jednoznacznych wyników. Ponieważ człowiek jest lepszy niż maszyna, aby dokładnie rozpoznać takie fragmenty, organizacje zajmujące się digitalizacją zasobów bibliotecznych zatrudniają pracowników, których zadaniem jest sprawdzanie błędów OCR.