Google Books


aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Google Book Search)
Wechseln zu: Navigation, Suche

Google Books (auch Google Bücher oder Google Buchsuche) ist die größte private Sammlung retrodigitalisierter Bücher. Sie befindet sich im Besitz des US-amerikanischen Unternehmens Google Inc. Die Sammlung ist in Auszügen öffentlich einsehbar. Nach eigenen Angaben ist ihr Ziel, das in Büchern niedergeschriebene Wissen vorwiegend durch Digitalisierung für eine Volltextsuche zur Verfügung zu stellen. Das Unternehmen gibt nicht bekannt, über wie viele digitalisierte Bücher es bereits verfügt.

Datei:Empty stacks (2518828977) (2).jpg
Vorübergehend leere Bücherregale in der Universität von Michigan: „Digitization in progress“ für Google Bücher, 2008

Beschreibung

Google Books speist sich aus zwei Quellen:

  • Google Print im engeren Sinn, dem – nicht weiter kontroversen – Kooperationsprojekt mit Verlagen, und
  • Google Library, bei dem Bücher großer akademischer Bibliotheken auch ohne vorherige Zustimmung der Rechteinhaber massenweise gescannt werden, was juristisch umstritten war und ist.<ref name="ZeitUS-Gericht">Google-Books: US-Gericht bremst Googles Bücherpläne. zeit online, 23. März 2011, abgerufen am 17. Mai 2012.</ref>

Geschichte

Im Oktober 2004 stellte sich Google Print auf der Frankfurter Buchmesse vor (Pressekonferenz mit den Google-Gründern Sergey Brin und Larry Page).<ref>Google-Gründer stellen in Frankfurt Google Print vor. heise online, 8. Oktober 2004, abgerufen am 17. Mai 2012.</ref> Im Dezember 2004 begannen Suchergebnisse aus gescannten Büchern in den Ergebnislisten der englischen Suchoberfläche Google.com zu erscheinen. Google hat sich vorgenommen 15 Millionen Bücher bis 2015 zu scannen.<ref>Google-Books: Richter setzt Streitparteien unter Druck. zeit Online, 9. April 2010, abgerufen am 17. Mai 2012.</ref> Das entspricht etwa 4,5 Milliarden Seiten.

Seit April 2005 existiert eine eigene Suche für die Inhalte des Programms. Im Oktober 2005 präsentierte man zur Frankfurter Buchmesse deutsche und anderssprachige Benutzungsoberflächen.

Am 4. November 2005 wurde die Suchseite, nunmehr mit einer erweiterten Suche versehen (Abfrage nach Zeiträumen nun möglich), offiziell vorgestellt. Am 17. November 2005 kündigte Google die Umbenennung des Dienstes im unternehmenseigenen Weblog an.<ref>Jen Grant: Judging Book Search by its cover. Official Google Blog, 17. November 2005, abgerufen am 17. Mai 2012.</ref> Seit diesem Zeitpunkt werden Anfragen von print.google.com nach books.google.com weitergeleitet.

Im September 2008 kündigte Google an, gemeinsam mit nordamerikanischen Zeitungsverlagen Zeitungen zu digitalisieren. Die digitalisierte Version soll durchsuchbar sein, mit dem Webbrowser navigierbar und erscheinen wie in der Printausgabe mitsamt den Fotografien, Schlagzeilen und Werbeanzeigen.<ref>Punit Soni: Bringing history online, one newspaper at a time. googleblog.blogspot.com 8. September 2008</ref>

Inzwischen gibt es bei einer Reihe von Büchern eine Kooperation mit Internet Archive. Dort gibt es Ausgaben in verschiedenen Formaten, für das PDF wird auf Google verwiesen (wo es für Werke nach 1864 für Nicht-US-Nutzer dann nicht verfügbar ist, siehe Kontroversen).

Aus dem Korpus von Google Bücher wurden 2009 und 2012 die Datensätze für den Ngram Viewer in verschiedenen Sprachen erstellt.

Kooperation mit den Verlagen

Google erhält von den Verlagen Bücher oder bekommt PDF-Dateien zugesandt. Die Bücher werden gescannt und durch OCR als E-Texte in den Index aufgenommen. Nutzer können jeweils nur vergleichsweise wenige Seiten des einzelnen Buchs einsehen. Nach einigen Seiten können nur (kostenfrei) registrierte Nutzer eine Anzahl weiterer Seiten einsehen. Eine Reihe von Seiten ist von vornherein für den Zugriff gesperrt. Nach Erschöpfung des Tageskontingents können keine weiteren Seiten betrachtet werden. Frei zugänglich sind in der Regel das Inhaltsverzeichnis, nicht selten auch das Register.

Google versucht die Inhalte durch eine Art Kopierschutz (sogenanntes „Digital Rights Management“ rsp. Digitale Rechtevergabe) zu schützen. Dass dies jedoch nicht immer vollständig angewandt wird, kann man an verschiedenen Fachbüchern problemlos nachvollziehen.<ref> So steht von dem Buch „Active Directory für Windows Server 2008“ von Addison-Wesley, ISBN 978-3-8273-2740-6, an manchen Tagen fast der gesamte Inhalt des Buches offen im Internet</ref> Angeschaute Seiten lassen sich nach dem Anzeigen im Internet-Browser mittels bestimmter Methoden dann sogar aus dessen Browser-Cache herauslesen und können mit entsprechenden Tools dann zu einer PDF-Datei zusammengeführt werden.

Kooperation mit Bibliotheken

Datei:Google Book Search - notice board at michigan university library.jpg
Google Books Hinweis in der Michigan University Library, 2007.

Google scannt seit etwa 2005 den kompletten Bestand der Bibliothek der University of Michigan (über 7 Millionen Bände) sowie große Teile der US-Universitätsbibliotheken der Harvard University und der Stanford University, der New York Public Library sowie in Europa der Bodleian Library der Oxford University. Auch die Bibliotheken der University of Virginia, der University of Wisconsin–Madison, der Princeton University, der University of California und der University of Texas at Austin beteiligen sich.

Ende 2006 traten zwei weitere Institutionen dem Verbund der Bibliotheken bei, die Bücher bei Google digitalisieren lassen: Die Nationalbibliothek von Katalonien (Biblioteca de Catalunya) in Barcelona und die Bibliothek der Universidad Complutense Madrid.

Am 6. März 2007 gab die Bayerische Staatsbibliothek in München bekannt, als erste deutsche Bibliothek mit dem Projekt zu kooperieren. Es sollen nun etwa eine Million urheberrechtsfreie Werke aus den historischen Beständen und aus Spezialsammlungen digitalisiert werden.<ref>Vorlage:Internetquelle/Wartung/Zugriffsdatum nicht im ISO-FormatVorlage:Internetquelle/Wartung/Datum nicht im ISO-FormatJens Redmer: The Bavarian State Library becomes largest non-English library partner. In: Inside Google Book Search. 6. März 2007, abgerufen am 11. März 2007.</ref> Ausgenommen von dem Digitalisierungsprojekt sind nur die Handschriften- und Inkunabelbestände sowie seltene und besonders wertvolle historische Drucke.<ref>Klaus Ceynowa: DER „BSB-GOOGLE-DEAL“. Eine Million Bücher der Bayerischen Staatsbibliothek online. In: BibliotheksMagazin. Mitteilungen aus den Staatsbibliotheken in Berlin und München Nr. 1/2008. S. 4-8, abgerufen am 17. Mai 2012 (PDF; 3,5 MB).</ref> Im Januar 2014 gab die der Bayerischen Staatsbibliothek nachgeordnete Staatliche Bibliothek Regensburg bekannt, ihren urheberrechtsfreien Bestand zusammen mit Google digitalisieren zu lassen. Bis Ende 2014 sollen 70.000 Bücher aus dem Bestand der Regensburger Bibliothek online sein. <ref>Staatliche Bibliothek Regensburg: Veranstaltungen & Meldungen</ref>

Im Juli 2008 gab die Bibliothèque Municipale de Lyon als erste französische Bibliothek bekannt, ihre Bücher digitalisieren zu lassen.<ref>Google digitalisiert Stadtbibliothek von Lyon, derstandard.at, 13. Juli 2008</ref>

Am 15. Juni 2010 gab die Österreichische Nationalbibliothek (ÖNB) bekannt, dass Google ihren urheberrechtsfreien Buchbestand digitalisiert. Die Kosten für die Digitalisierung der rund 400.000 Bücher betragen etwa 30 Mio. Euro und werden von Google getragen. ÖNB-Generaldirektorin Johanna Rachinger bezeichnete dieses Vorhaben als eines der größten Public Private Partnership in der österreichischen Kulturlandschaft. 400.000 Bände vom 16. bis ins 19. Jahrhundert (mit Ausnahme jener Bücher, bei denen konservatorische Bedenken dagegen sprechen) sollen dabei im Volltext erfasst werden – rund 120 Millionen Buchseiten sind danach online und kostenlos abrufbar.<ref>APA: Google digitalisiert Nationalbibliothek. Abgerufen am 13. Februar 2012.</ref>

Heftige Kritik von Autoren- und Verlegerseite brachte Google dazu, das Scannen von urheberrechtlich geschützten Büchern bis November 2005 auszusetzen. Bis zu diesem Zeitpunkt sollten die Rechteinhaber angeben, welche Bücher sie nicht zugänglich gemacht haben möchten (Opt-out-Lösung). Während Google sich auf den fair use des US-Rechts beruft und dabei von renommierten Juristen unterstützt wird, fordern die Verleger und Autorenverbände, dass kein Buch ohne Zustimmung ins Programm eingestellt wird (Opt-in). Im Oktober 2005 wurden in den USA Klagen von Autoren und Verlegern gegen Google eingereicht.

Anwendung in der Forschung

Ein im Dezember 2010 in Science veröffentlichter Aufsatz berichtete über die Möglichkeiten, Google Books zur quantitativen Analyse von Kultur zu nutzen (Culturomics). Den Wissenschaftlern standen für ihre Analysen etwa 4 % aller Bücher, die jemals gedruckt wurden, zur Verfügung. Sie konvertierten die Bücher in eine massive Datenbank der in den Büchern enthaltenen Wörter (N-Gramm). Die Herangehensweise lasse sich für Forschungen auf verschiedenen Gebieten wie Lexikographie, Evolution von Grammatik, kollektivem Gedächtnis, Technologieadoption, Ruhm, Zensur oder historischer Epidemiologie nutzen. Das Forscherteam schätzte z. B. auf Basis der Datenbank, dass sich die Größe des englischen Wortschatzes innerhalb des letzten Jahrhunderts fast verdoppelt habe. In einer anderen Untersuchung wurde der kulturelle Einfluss Sigmund Freuds mit dem Charles Darwins verglichen. Freud verlor demnach an Einfluss; Darwin habe Freud im Jahr 2005 überholt.<ref>John Bohannon: Google Opens Books to New Cultural Studies (PDF; 184 kB). In: Science, Band 330, 17. Dezember 2010. S. 1600.</ref><ref>Jean-Baptiste Michel, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K. Gray, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, Erez Lieberman Aiden: Quantitative Analysis of Culture Using Millions of Digitized Books. In: Science, Vol. 331, 16. Dezember 2010. S. 176-182.</ref>

Kontroversen

Belege Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Die fraglichen Angaben werden daher möglicherweise demnächst entfernt. Bitte hilf der Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst. Näheres ist eventuell auf der Diskussionsseite oder in der Versionsgeschichte angegeben. Bitte entferne zuletzt diese Warnmarkierung.

Probleme der Auswahl der Digitalisate

Der Historiker Jean-Noël Jeanneney - ehemaliger Direktor der Französischen Nationalbibliothek, der mit Gallica ein freies europäisches Digitalisierungsprojekt betreibt - plädiert dafür, dass Europa eine Alternative zum Google-Digitalisierungsprojekt auf die Beine stellt. An Google kritisiert er vor allem die Hegemonie des Englischen und den Kumulationseffekt (bei ihm genannt die „Blickfang-Methode“, üblich ist der Begriff „Ranking“, siehe: PageRank), der dazu führe, dass im Kampf um die Aufmerksamkeit des Lesers eine gewollte Konzentration auf die Listenführer stattfinde. Der stärkere Anbieter wird immer noch stärker auf Kosten des Schwächeren. Dadurch werde Google besonders für die Werbung wichtig. Diesem „kapitalistischen“ Google-Prinzip möchte Jeanneney ein Modell entgegensetzen, bei dem der Staat das Sagen in Dingen des kulturellen Gedächtnisses hat. 19 National- und Universitätsbibliotheken in Europa haben den Appell der französischen Nationalbibliothek unterzeichnet, um eine drohende geistige und kulturelle Vorherrschaft der USA zu verhindern.

Das Problem, dass Google Books mit seiner Marktdominanz durch seine Selektionspraxis Alternativen verstellt, wird auch in Deutschland gesehen, insbesondere bei der Recherche auf Spezialgebieten wie etwa der Lokalgeschichte oder der Mundartforschung.<ref>Peter Bürger: Grimmiges über Google Books. Telepolis, 6. Januar 2012.</ref>

Probleme bei den Suchfunktionen

Eine Zuordnung von systematischen Sachgruppen und Schlagworten zu den Büchern wie in Bibliothekskatalogen erfolgt nicht. Bücher eines bestimmten Fachgebietes zu selektieren, ist nicht möglich. Google geht davon aus, es genüge für die thematische Suche, alle Wörter in den Büchern zu erfassen. Die Eingabe eines Stichworts kann aber immer nur Ergebnisse in der verwendeten Sprache liefern. Es wird nicht berücksichtigt, dass oft auch sprachübergreifend gesucht wird und dass ein Wort in mehreren Fachgebieten verwendet werden und unterschiedliche Bedeutungen haben kann.<ref name="Grün_Anz">Für Beispiele siehe: Bücher suchen mit Google. In: Grüner Anzeiger, 12, November 2009, S. 30.</ref>

Probleme bei der Texterkennung

Datei:Digitized by Google-20060530.jpg
Digitalisat von Google. Sichtbare Finger des Personals am Scanner.

Der Spiegel bemängelte im Jahr 2007 die oft miserable OCR-Qualität und die mangelhaften Metadaten.<ref>Malte Herwig: Die entleibte Bibliothek. In: Der Spiegel, 12/2007, S. 186 f.</ref>

Es gibt Fälle, in denen sogar der Autorenname vom OCR falsch erkannt wurde, so dass das Werk unter dem Autorennamen nicht gefunden werden kann.<ref name="Grün_Anz"/> Die sichtbare Qualität der Seiten wird wiederholt kritisiert. Dies betrifft die Punkte fehlende Textstellen und sichtbare Finger des Personals am Scanner.<ref>Kritik auf Blogseite des VÖBB (Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare); abgerufen am 10. Februar 2013</ref>

2009 kaufte Google den weltweit auf verschiedenen Websites eingesetzten CAPTCHA-Dienst reCAPTCHA, um die automatische Texterkennung als Nebenprodukt von Menschen überprüfen zu lassen.

Urheberrechte

Mitglieder des Konkurrenzprojektes der Open Content Alliance kritisieren das Vorgehen von Google, das keine Rücksicht auf Copyright nehme.

In Deutschland fordern im Heidelberger Appell Schriftsteller, Verlage und Wissenschaftler den Schutz des Urheberrechts gegen seine Aushöhlung. In dem Manifest werden zwei Dinge miteinander verbunden: die Kritik an der Google-Buch-Digitalisierung mit einer Kritik an Open-Access-Politik im Allgemeinen. Dies hat zu einer Zersplitterung der Kritiker des rasch voranschreitenden Google-Digitalisierungsprojekts geführt. Ein großes Problem sieht der Heidelberger Appell insbesondere im sogenannten Google Book Settlement.

Google Book Settlement

Das Google Book Settlement<ref name="GBS_01">Google Book Settlement, Google</ref> ist ein Vergleichsvorschlag, den Google Inc. auf eine Sammelklage US-amerikanischer Verlage und Autoren gegen sie ausgearbeitet hat. Sollte dieser Vergleich vor dem New Yorker Gericht zustande kommen, so betrifft er auch nicht-amerikanische Verlage und Autoren, da Google über das Internet weltweit erreichbar ist. Zudem könnten Autoren gegen die Vergleichsvereinbarungen nach amerikanischem Recht nicht mehr nachträglich prozessieren, sofern sie sich nicht zuvor durch individuellen Einspruch aus der Sammelklage ausgeschlossen haben.<ref>Amerikanische Justiz prüft Googles Vergleich, F.A.Z, 29. April 2009</ref><ref> Michael W. Perry: Alles hängt jetzt von Europa ab, F.A.Z., 5. Mai 2009</ref><ref>Burkhard Hess: Es wird Zeit, dass die Bundesregierung eingreift, F.A.Z., 7. Mai 2009</ref> Google könnte dann jedes Werk deutschsprachiger Autoren, die keinen Einspruch in den USA eingelegt haben, in digitalisierter Form auf seiner Plattform zur Ansicht stellen, ohne dass hiergegen noch rechtlicher Einspruch der Autoren möglich wäre.

Anfang Mai 2009 wurde das abschließende Anhörungsverfahren für das Google Book Settlement vom 11. Juli 2009 auf den 6. Oktober 2009 vertagt. Die Widerspruchsfrist für Verlage und Autoren („Nicht-Teilnahme-Frist“) wurde vom 5. Mai 2009 bis zum 4. September 2009 verlängert.<ref name="GBS_01"/><ref>Anhörung zum Google-Vergleich verschoben, Warten auf Settlement 2.0. Abgerufen am 17. Mai 2012.</ref><ref name="asja">ASJA Opposes Google Settlement. Abgerufen am 17. Mai 2012.</ref> Für den deutschen Buchmarkt hat die VG Wort einen eigenen Regelungsvorschlag ausgearbeitet. VG Wort kritisiert und klagt auf der einen Seite gegen Aspekte dieser möglichen Einigung vor einem amerikanischen Gericht. Auf der anderen Seite arbeitet die VG Wort auch mit Google bei der geplanten Umsetzung der Einigung zusammen.

Am 1. September 2009 kritisierte die Bundesregierung den Einigungsvorschlag. Sie forderte, dass man zumindest eine eigene Klasse für die deutschen Rechteinhaber bilden solle und diese von der pauschalen Einigung ausnehme. Zudem behindere Googles Copyright-Verletzungen und das Verhalten „Erst tun, dann fragen“ Projekte wie die europäische Online-Bibliothek Europeana, die Autorenrechte vorab wahre.<ref>Google-Buchsuche Bundesregierung erhebt Einspruch - Spiegel Online. Abgerufen am 17. Mai 2012.</ref>

In den USA kritisierte etwa die American Society of Journalists and Authors die Einigung als einen internen Handel zugunsten der daran Beteiligten.<ref name="asja"/> Auch in der FAZ wird der Verdacht eines sogenannten „Coupon-settlements“ nahegelegt, bei dem selbsternannte Klägeranwälte mit Google eine „Einigung“ aushandeln, um ein üppiges Honorar und eine marktdominierende Stellung für Google zu erreichen.<ref>Google Book Settlement Es wird Zeit, dass die Bundesregierung eingreift - FAZ. Abgerufen am 17. Mai 2012.</ref>

Anlässlich einer Expertenanhörung durch die EU-Kommission am 7. September 2009 erklärte Google, auf die Bedenken von Verlegern und Autoren eingehen zu wollen und deren Vertreter an der Beaufsichtigung des Projekts Google Books zu beteiligen. In Europa urheberrechtlich geschützte und lieferbare Bücher sollen nicht ohne ausdrückliche Erlaubnis gescannt und online zugänglich gemacht werden.<ref>Zugeständnisse an europäische Verlage? Focus Online, 7. September 2009</ref> Gleichzeitig kündigte die EU-Kommission an, das Urheberrecht ändern zu wollen, da aufgrund der Gesetzeslage nur die USA von den Vorteilen der Digitalisierung und Online-Vermarktung profitieren würden.<ref>EU-Kommission will das Urheberrecht novellieren Handelsblatt, 7. September 2009</ref>

Im September 2011 wurde bekannt:

„In einem überraschenden Vorgehen verpassten Autorenverbände ihren ehemaligen Bündnispartnern, den Universitäten, eine gerichtliche Klage, in der sie verlangen, dass die Hochschulen die digitalen Büchersammlungen aufgeben und die Zusammenarbeit mit Google einstellen. Die Klage eröffnet eine neue Runde im Kampf um digitale Büchereien und kommt in derselben Woche, in der dem umstrittenen "Google book settlement" voraussichtlich vor Gericht der Garaus gemacht wird.<ref>In a surprise move, authors’ groups slammed their one-time university partners with a lawsuit demanding that the schools surrender digital collections and stop working with Google (NSDQ: GOOG). The lawsuit opens a new phase in the fight over digital libraries and comes the same week that Google’s controversial books settlement is expected to die in court.Authors To Universities: Give Up Your Google Books - paidContent. Abgerufen am 17. Mai 2012.</ref>“

Im November 2013 wurde im Urheberrechtsverfahren der amerikanischen Authors Guild gegen Google der Antrag auf einen Geschworenenprozess abgewiesen und gleichzeitig festgehalten, dass Google Books grundsätzlich durch das „Fair Use“-Prinzip gedeckt sei.<ref>heise.de: Google Books nach acht Jahren vor Gericht für legal erklärt. 15. November 2013, abgerufen am 15. November 2013.</ref> Dieses Urteil wurde im Oktober 2015 in zweiter Instanz bestätigt.<ref>heise.de: Berufungsgericht bestätigt: Google Books ist in den USA legal. 16. Oktober 2015, abgerufen am 16. Oktober 2015.</ref>

Andere Projekte

  • Die Open Content Alliance u. a. mit Konkurrent Yahoo, dem Internetarchiv und der University of California hat im Rahmen der Open Library in großem Umfang Bücher katalogisiert und digitalisiert, als Open Content und unter strikter Wahrung des Urheberrechts.
  • Auch der Konkurrent und mögliche Partner von Google, das Internet-Versandhaus Amazon bietet gescannte Bücher im Volltext an, konzentriert sich jedoch auf aktuell im Handel erhältliche Bücher, und will damit den Verkauf gedruckter Bücher fördern. Mit seiner Suche „Search Inside the Book“<ref>Amazon „Search Inside the Book“</ref> macht Amazon Titelseite, Klappentext, Inhaltsverzeichnis, Register und zwei Seiten vor und hinter einem Suchergebnis verfügbar.
  • Die Suchmaschine A9.com, eine Amazon-eigene Suchmaschine, die Microsofts Suchtechnologie mit Amazons „Search Inside the Book“ verknüpft, zeigt auf der Basis eines noch kleinen, englischsprachigen Katalogs, wie sich in eingescannten Büchern, Bildern und Websites übergreifend suchen lässt.
  • MINERVA
  • die Internetprojekte Wikisource und Project Gutenberg
  • Gallica
  • The European Library, eine europäische Initiative, die den Zugang zu den digitalisierten Werken der Mitgliedsländer verbessern soll.
  • Auch große Verlage wie Random House (Bertelsmann) beginnen, ihre Buchbestände zu digitalisieren und für Suchmaschinen auffindbar zu machen. Random House stellte im Februar 2007 Teile seiner Buchbestände (5.000 Titel, weitere sollen folgen) online.<ref>Stuart Applebaum: Insight, newly launched digital search & browsing service to offer 5,000-plus Random House, Inc. U.S. titles (PDF-Datei; 31 kB), Pressemitteilung, 27. Februar 2007</ref> Mit Insight ermöglicht das Unternehmen seinen Kunden eine festgelegte Anzahl von Seiten pro Titel zu durchsuchen.<ref>Insight Web Service, Random House</ref>
  • Seit Oktober 2007 ist mit Zeno.org eine weitere Online-Bibliothek verfügbar.
  • Libreka – die deutsche Antwort des Börsenvereins des Deutschen Buchhandels auf Google Book Search

Literatur

Weblinks

Commons Commons: Google Books – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

<references />