Quantcast
Channel: Annette Grabowsky | Blog
Viewing all articles
Browse latest Browse all 15

Bücher digitalisieren mit Captchas

$
0
0
ReCAPTCHA Screenshot Ungefähr 60 Millionen Captchas (Bildchen mit leicht verzerrten Buchstaben, deren Text man vor dem Abschicken von Webformularen oft eingeben muß) werden täglich gelöst.

ReCAPTCHA macht sich diese Arbeitszeit zunutze und bietet als Captchas Texte von gescannten Büchern an, die mittels OCR nicht einwandfrei gelesen werden konnten. Jedes ausgefüllte Recaptcha trägt also zum Fortschritt von Digitalisierungsprojekten bei. Im Moment hilft Recaptcha bei der Digitalisierung von Büchern bei archive.org.

Der Nutzer muß bei jedem Captcha zwei Wörter eingeben: ein Wort, das noch nicht erkannt wurde, und ein Wort, dessen Lösung bereits bekannt ist. Löst der Nutzer das bekannte Wort richtig, geht der Computer davon aus, daß er auch das zweite, unbekannte Wort richtig gelesen hat. Dieses Wort wird zur Überprüfung auch noch anderen Nutzern gegeben. Schlaue Technik.

Deshalb habe ich die Captchas dieses Blogs nun durch Recaptchas ersetzt.

Viewing all articles
Browse latest Browse all 15