Ist das eine gute Nachricht? Google indiziert jetzt auch den Text (!) von gescannten Dokumenten – vorausgesetzt, das Dokument befindet sich in einem PDF. JPGs und ander Bild-Dateien bleiben außen vor.
INdizierung von gescannten Dokumenten ist klasse für historische Dokumente und alles was aus der Vor-Computer-Zeit stammt. Zeitungsarchive und öffentliche Dokumenten-Archive, vor allem.
Ansonsten frage ich mich aber: Wer stellt Texte in gescannter Form als PDF ins Web? Wenn ich Verfasser und damit Urheber eines Textes bin, dann habe ich den Text in elektronischer Form und muss ihn nicht erst ausdrucken und einscannen. Bin ich nicht Urheber, fehlen mir zumeist die Rechte, das Dokument öffentlich zugänglich zu machen. Im Zweifel erreicht Google damit also auch eine Zunahme von Urheberrechtsverstößen im Web.