Książki Google - Google Books

książki Google
Logo Książek Google 2015.svg
Zrzut ekranu
Książki Google zrzut ekranu.png
Rodzaj strony
Biblioteka Cyfrowa
Właściciel Google
URL książki .google .com
Wystrzelony październik 2004 ; 17 lat temu (jako Google Print) ( 2004-10 )
Aktualny stan Aktywny

Książki Google (wcześniej znane jako Google Book Search i Google Print i pod kryptonimem Project Ocean ) to usługa firmy Google Inc., która przeszukuje pełny tekst zeskanowanych przez Google książek i czasopism, konwertując go na tekst za pomocą optycznego rozpoznawania znaków ( OCR) i przechowywane w jego cyfrowej bazie danych. Książki są dostarczane przez wydawców i autorów w ramach programu partnerskiego Google Books lub przez partnerów bibliotecznych Google w ramach programu bibliotecznego Library Project. Ponadto Google współpracuje z wieloma wydawcami czasopism, aby zdigitalizować ich archiwa.

Program dla wydawców był po raz pierwszy znany jako Google Print, kiedy został wprowadzony na Targach Książki we Frankfurcie w październiku 2004 r. Projekt Google Books Library Project, który skanuje dzieła w zbiorach partnerów bibliotecznych i dodaje je do cyfrowego ekwipunku, został ogłoszony w grudniu 2004 r. .

Inicjatywa Google Books została okrzyknięta jej potencjałem oferowania bezprecedensowego dostępu do tego, co może stać się największym internetowym zbiorem ludzkiej wiedzy i promowania demokratyzacji wiedzy . Jednak został również skrytykowany za potencjalne naruszenia praw autorskich i brak edycji w celu poprawienia wielu błędów wprowadzonych do zeskanowanych tekstów przez proces OCR.

W październiku 2015 r. liczba zeskanowanych tytułów książek wynosiła ponad 25 milionów, ale w amerykańskich bibliotekach akademickich proces skanowania uległ spowolnieniu. Google oszacowało w 2010 roku, że na świecie istnieje około 130 milionów odrębnych tytułów i stwierdziło, że zamierza przeskanować je wszystkie. W październiku 2019 r. Google obchodziło 15-lecie Google Books i podało liczbę zeskanowanych książek jako ponad 40 milionów tytułów.

Próby skanowania Google Book były przedmiotem sporu sądowego, w tym Authors Guild przeciwko Google , pozew zbiorowy w Stanach Zjednoczonych. Był to poważny przypadek, który zbliżył się do zmiany praktyk dotyczących praw autorskich do utworów osieroconych w Stanach Zjednoczonych.

Detale

Wyniki z Książek Google są wyświetlane zarówno w uniwersalnej wyszukiwarce Google, jak i w dedykowanej witrynie wyszukiwania Książek Google ( books.google.com ).

W odpowiedzi na zapytania w serwisie Książki Google umożliwiają użytkownikom przeglądanie całych stron książek, w których pojawiają się wyszukiwane hasła, jeśli książka nie jest objęta prawami autorskimi lub jeśli właściciel praw autorskich udzielił pozwolenia. Jeśli Google uzna, że ​​książka nadal jest objęta prawami autorskimi, użytkownik widzi „fragmenty” tekstu wokół zapytanych wyszukiwanych haseł. Wszystkie wystąpienia wyszukiwanych haseł w tekście książki są podświetlone na żółto.

Cztery poziomy dostępu używane w Książkach Google to:

  • Pełny widok : książki w domenie publicznej są dostępne w „pełnym widoku” i można je pobrać bezpłatnie. Książki in-print nabyte w ramach programu partnerskiego są również dostępne do pełnego wglądu, jeśli wydawca wyraził na to zgodę, chociaż zdarza się to rzadko.
  • Podgląd : w przypadku książek drukowanych, w przypadku których udzielono zgody, liczba widocznych stron jest ograniczona do „podglądu” ustawionego przez różne ograniczenia dostępu i środki bezpieczeństwa, niektóre oparte na śledzeniu przez użytkownika. Zwykle wydawca może ustawić procent książki dostępnej do podglądu. Użytkownicy nie mogą kopiować, pobierać ani drukować podglądów książek. Na dole stron pojawia się znak wodny z napisem „Materiały chronione prawem autorskim”. Wszystkie książki nabyte w programie partnerskim są dostępne do podglądu.
  • Widok fragmentu : „widok fragmentu” — dwa lub trzy wiersze tekstu otaczające wyszukiwane hasło — jest wyświetlany w przypadkach, gdy Google nie ma uprawnień właściciela praw autorskich do wyświetlania podglądu. Może to być spowodowane tym, że Google nie może zidentyfikować właściciela lub właściciel odmówił zgody. Jeśli wyszukiwane hasło pojawia się w książce wiele razy, Google wyświetla nie więcej niż trzy fragmenty, uniemożliwiając w ten sposób użytkownikowi przeglądanie zbyt dużej części książki. Ponadto Google nie wyświetla żadnych fragmentów niektórych podręczników, takich jak słowniki, w przypadku których wyświetlanie nawet fragmentów może zaszkodzić rynkowi pracy. Google utrzymuje, że zgodnie z prawem autorskim nie jest wymagane żadne pozwolenie na wyświetlanie widoku fragmentu.
  • Brak podglądu : Google wyświetla również wyniki wyszukiwania książek, które nie zostały zdigitalizowane. Ponieważ te książki nie zostały zeskanowane, ich tekstu nie można przeszukiwać, a jedynie metadane, takie jak tytuł, autor, wydawca, liczba stron, numer ISBN, temat i informacje o prawach autorskich, a w niektórych przypadkach spis treści i streszczenie książki są do dyspozycji. W efekcie jest to podobne do internetowego katalogu kart bibliotecznych.

W odpowiedzi na krytykę ze strony takich grup, jak American Association of Publishers i Authors Guild , Google ogłosił w sierpniu 2005 r. politykę rezygnacji , dzięki której właściciele praw autorskich mogą dostarczyć listę tytułów, których nie chcą skanować, a prośba będzie Być respektowanym. Firma oświadczyła również, że nie będzie skanować żadnych książek objętych prawami autorskimi w okresie od sierpnia do 1 listopada 2005 r., aby zapewnić właścicielom możliwość decydowania, które książki wykluczyć z Projektu. W związku z tym właściciele praw autorskich mają trzy możliwości wyboru w odniesieniu do każdego dzieła:

  1. Może uczestniczyć w Programie Partnerskim, aby udostępnić książkę do podglądu lub pełnego widoku, w którym to przypadku dzieliłby się przychodami uzyskanymi z wyświetlania stron z pracy w odpowiedzi na zapytania użytkowników.
  2. Może pozwolić Google zeskanować książkę w ramach programu bibliotecznego Library Project i wyświetlić fragmenty w odpowiedzi na zapytania użytkowników.
  3. Może zrezygnować z programu bibliotecznego Library Project, w którym to przypadku Google nie zeskanuje książki. Jeśli książka została już zeskanowana, Google zresetuje jej poziom dostępu na „Brak podglądu”.

Większość zeskanowanych prac nie jest już drukowana ani dostępna na rynku.

Oprócz zamawiania książek w bibliotekach Google pozyskuje również książki od swoich partnerów wydawców w ramach „Programu partnerskiego”, który ma pomóc wydawcom i autorom w promowaniu ich książek. Wydawcy i autorzy przesyłają cyfrową kopię swojej książki w formacie EPUB lub PDF albo kopię drukowaną do Google, która jest udostępniana do podglądu w Książkach Google. Wydawca może kontrolować procent książki dostępnej do podglądu, przy czym minimum to 20%. Mogą również zdecydować, czy książka będzie w pełni widoczna, a nawet zezwolić użytkownikom na pobranie kopii w formacie PDF. Książki można również udostępniać do sprzedaży w Google Play. W przeciwieństwie do Library Project nie budzi to zastrzeżeń dotyczących praw autorskich, ponieważ jest prowadzone na podstawie umowy z wydawcą. Wydawca może w każdej chwili odstąpić od umowy.

W przypadku wielu książek Książki Google wyświetlają oryginalne numery stron. Jednak Tim Parks , pisząc w The New York Review of Books w 2014 r., zauważył, że Google przestał podawać numery stron wielu ostatnich publikacji (prawdopodobnie pozyskanych w ramach programu partnerskiego) „prawdopodobnie we współpracy z wydawcami, aby wymusić tych z nas, którzy muszą przygotować przypisy, aby kupić wydania papierowe”.

Skanowanie książek

Projekt rozpoczął się w 2002 roku pod kryptonimem Project Ocean. Współzałożyciel Google, Larry Page, zawsze interesował się digitalizacją książek. Kiedy on i Marissa Mayer zaczęli eksperymentować ze skanowaniem książek w 2002 roku, digitalizacja 300-stronicowej książki zajęła im 40 minut. Ale wkrótce po tym, jak technologia została opracowana do tego stopnia, że ​​operatorzy skanowania mogli skanować do 6000 stron na godzinę.

Google ustanowił wyznaczone centra skanowania, do których książki przywożono ciężarówkami. Stacje mogły digitalizować z prędkością 1000 stron na godzinę. Książki zostały umieszczone w wykonanej na zamówienie mechanicznej kołysce, która dopasowywała grzbiet książki na miejscu, podczas gdy szereg świateł i instrumentów optycznych skanował dwie otwarte strony. Każda strona miałaby skierowane na nią dwie kamery rejestrujące obraz, podczas gdy dalmierz LIDAR nakładał trójwymiarową siatkę laserową na powierzchnię książki, aby uchwycić krzywiznę papieru. Operator przewracał strony ręcznie, używając pedału nożnego do robienia zdjęć. Bez konieczności spłaszczania stron lub ich idealnego wyrównywania, system Google nie tylko osiągnął niezwykłą wydajność i szybkość, ale także pomógł chronić delikatne kolekcje przed nadmierną obsługą. Następnie surowe obrazy przeszły trzy poziomy przetwarzania: najpierw algorytmy usuwania wypaczenia wykorzystywały dane LIDAR do ustalania krzywizny stron. Następnie oprogramowanie do optycznego rozpoznawania znaków (OCR) przekształciło nieprzetworzone obrazy w tekst, a na koniec kolejna runda algorytmów wyodrębniła numery stron, przypisy, ilustracje i diagramy.

Wiele książek jest skanowanych za pomocą dostosowanej kamery Elphel 323 z szybkością 1000 stron na godzinę. Patent przyznany Google w 2009 roku ujawnił, że Google miał wymyślić innowacyjny system do skanowania książek, które wykorzystuje dwie kamery i światło podczerwone automatycznie poprawne dla krzywizny stron w książce. Konstruując model 3D każdej strony, a następnie „odkształcając” go, Google jest w stanie zaprezentować płasko wyglądające strony bez konieczności naprawdę spłaszczania stron, co wymaga użycia destrukcyjnych metod takich jak rozpinanie lub spłaszcz każdą stronę, co jest nieefektywne w przypadku skanowania na dużą skalę.

Funkcjonalność strony internetowej

Dla każdej pracy Google Books automatycznie generuje stronę przeglądu. Na tej stronie wyświetlane są informacje wyodrębnione z książki — szczegóły dotyczące publikacji, mapa słów o wysokiej częstotliwości, spis treści — a także materiały dodatkowe, takie jak streszczenia, recenzje czytelników i linki do innych odpowiednich tekstów. Na przykład odwiedzający stronę może zobaczyć listę książek o podobnym gatunku i tematyce lub listę aktualnych stypendiów dotyczących książki. Ta treść oferuje ponadto interaktywne możliwości użytkownikom zalogowanym na swoje konto Google . Mogą eksportować dane bibliograficzne i cytaty w standardowych formatach , pisać własne recenzje, dodawać je do swojej biblioteki w celu oznaczania, organizowania i udostępniania innym osobom. Dlatego Książki Google zbierają te bardziej interpretacyjne elementy z różnych źródeł, w tym od użytkowników, witryn innych firm, takich jak Goodreads , a często także od autora i wydawcy książki.

W rzeczywistości, aby zachęcić autorów do przesyłania własnych książek, Google dodał kilka funkcji do witryny. Autorzy mogą zezwolić odwiedzającym na pobranie ich ebooka za darmo lub mogą ustalić własną cenę zakupu. Mogą zmieniać cenę tam iz powrotem, oferując zniżki, kiedy im to odpowiada. Ponadto, jeśli autor książki zdecyduje się dodać numer rekordu ISBN , LCCN lub OCLC , usługa zaktualizuje adres URL książki, aby go uwzględnić. Następnie autor może ustawić konkretną stronę jako kotwicę linku. Ta opcja ułatwia znalezienie książki.

Przeglądarka Ngramów

Przeglądarka Ngram to usługa połączona z Książkami Google, która przedstawia wykresy częstotliwości użycia słów w ich kolekcji książek. Usługa jest ważna dla historyków i językoznawców, ponieważ może zapewnić wgląd w kulturę ludzką poprzez użycie słów w różnych okresach czasu. Ten program został skrytykowany z powodu błędów w metadanych używanych w programie.

Problemy z treścią i krytyka

Projekt spotkał się z krytyką, że zadeklarowany cel zachowania dzieł osieroconych i wyczerpanych z druku jest zagrożony z powodu błędów zeskanowanych danych i nierozwiązania takich problemów.

Użytkownicy mogą zgłaszać błędy w zeskanowanych książkach Google na support.google.com/books/partner/troubleshooter/2983879 .

Błędy skanowania

Ręka zeskanowana w książce Google

Proces skanowania jest obarczony błędami. Na przykład niektóre strony mogą być nieczytelne, do góry nogami lub w złej kolejności. Uczeni zgłaszali nawet zmięte strony, zasłanianie kciuków i palców oraz zamazane lub zamazane obrazy. W tej kwestii deklaracja Google na końcu zeskanowanych książek mówi:

Digitalizacja na najbardziej podstawowym poziomie opiera się na obrazach stron fizycznych książek. Aby udostępnić tę książkę jako plik w formacie ePub, zrobiliśmy te obrazy stron i wyodrębniliśmy tekst za pomocą technologii optycznego rozpoznawania znaków (lub w skrócie OCR). Wyodrębnienie tekstu z obrazów stron jest trudnym zadaniem inżynierskim. Smugi na fizycznych stronach książek, fantazyjne czcionki, stare czcionki, podarte strony itp. mogą prowadzić do błędów w wyodrębnionym tekście. Niedoskonały OCR to tylko pierwsze wyzwanie w ostatecznym celu przejścia od kolekcji obrazów stron do książek opartych na wyodrębnionym tekście. Nasze algorytmy komputerowe muszą również automatycznie określić strukturę książki (jakie są nagłówki i stopki, gdzie umieszczane są obrazy, czy tekst jest wierszem czy prozą itd.). Uzyskanie tego prawa pozwala nam renderować książkę w sposób zgodny z formatem oryginalnej książki. Pomimo naszych najlepszych starań możesz zauważyć błędy ortograficzne, śmieciowe znaki, obce obrazy lub brakujące strony w tej książce. Według naszych szacunków te błędy nie powinny przeszkadzać w czerpaniu przyjemności z treści książki. Wyzwania techniczne związane z automatycznym tworzeniem idealnej książki są zniechęcające, ale wciąż ulepszamy nasze technologie OCR i ekstrakcji struktury książki.

Od 2009 r. Google oświadczył, że zacznie używać reCAPTCHA, aby naprawić błędy znalezione w skanach Google Book. Ta metoda poprawiłaby tylko zeskanowane słowa, które są trudne do rozpoznania ze względu na proces skanowania i nie może rozwiązać błędów, takich jak przewracane strony lub blokowane słowa.

Błędy w metadanych

Uczeni często zgłaszali szerzące się błędy w informacjach o metadanych w Książkach Google – w tym błędnie przypisani autorzy i błędne daty publikacji. Geoffrey Nunberg , lingwista badający zmiany w użyciu słów w czasie, zauważył, że wyszukiwanie książek opublikowanych przed 1950 r. i zawierających słowo „internet” przyniosło mało prawdopodobne 527 wyników. Woody Allen jest wymieniony w 325 książkach rzekomo opublikowanych przed jego urodzeniem. Google odpowiedział firmie Nunberg, zrzucając winę za większość błędów na zewnętrznych wykonawców.

Inne zgłaszane błędy metadanych obejmują daty publikacji przed narodzinami autora (np. 182 prace Charlesa Dickensa przed jego narodzinami w 1812 r.); nieprawidłowe klasyfikacje tematyczne (wydanie Moby Dicka znalezione w kategorii „komputery”, biografia Mae West sklasyfikowana jako „religia”), sprzeczne klasyfikacje (10 wydań Whitman's Leaves of Grass wszystkie sklasyfikowane jako „fikcja” i „literatura faktu”), błędnie napisane tytuły, autorzy i wydawcy ( Moby Dick: lub Biała „ściana” ), a metadane jednej książki błędnie dołączone do zupełnie innej książki (metadane dla pracy matematycznej z 1818 r. prowadzą do romansu z 1963 r.).

Przeprowadzono przegląd elementów metadanych autora, tytułu, wydawcy i roku publikacji dla 400 losowo wybranych rekordów Google Books. Wyniki pokazują, że 36% próbkowanych książek w projekcie digitalizacji zawierało błędy metadanych. Ten poziom błędu jest wyższy niż można by się spodziewać w typowym bibliotecznym katalogu online.

Ogólny wskaźnik błędów wynoszący 36,75% stwierdzony w tym badaniu sugeruje, że metadane Google Books mają wysoki wskaźnik błędów. Chociaż „poważne” i „mniejsze” błędy są subiektywnym rozróżnieniem opartym na nieco nieokreślonym pojęciu „znajdowalności”, wszystkie błędy znalezione w czterech elementach metadanych zbadanych w tym badaniu należy uznać za poważne.

Błędy metadanych wynikające z nieprawidłowych zeskanowanych dat utrudniają wyszukiwanie przy użyciu bazy danych Google Books Project. Firma Google wykazała jedynie ograniczone zainteresowanie usuwaniem tych błędów.

Problemy językowe

Niektórzy europejscy politycy i intelektualiści krytykowali wysiłki Google'a z powodu językowego imperializmu . Twierdzą, że ponieważ zdecydowana większość książek proponowanych do zeskanowania jest w języku angielskim, spowoduje to nieproporcjonalną reprezentację języków naturalnych w świecie cyfrowym. Na przykład niemiecki, rosyjski, francuski i hiszpański są popularnymi językami w nauce. Jednak nieproporcjonalny nacisk online na język angielski może kształtować dostęp do nauki historycznej, a ostatecznie rozwój i kierunek przyszłej nauki. Wśród tych krytyków jest Jean-Noël Jeanneney , były prezes Bibliothèque Nationale de France .

Książki Google a Google Scholar

Chociaż Google Books zdigitalizowało dużą liczbę starych numerów czasopism, ich skany nie zawierają metadanych wymaganych do identyfikacji określonych artykułów w określonych wydaniach. Skłoniło to twórców Google Scholar do uruchomienia własnego programu do digitalizacji i hostowania starszych artykułów z czasopism (w porozumieniu z ich wydawcami).

Partnerzy biblioteczni

Projekt biblioteczny Google Books Library Project ma na celu skanowanie i umożliwienie przeszukiwania zbiorów kilku dużych bibliotek naukowych . Oprócz informacji bibliograficznych często można wyświetlić fragmenty tekstu z książki. Jeśli książka nie jest chroniona prawami autorskimi i znajduje się w domenie publicznej, można ją w pełni przeczytać lub pobrać .

Książki objęte prawami autorskimi zeskanowane w ramach programu bibliotecznego Library Project są udostępniane w Książkach Google w celu wyświetlenia fragmentu. Jeśli chodzi o jakość skanów, Google przyznaje, że „nie zawsze są one wystarczająco wysokiej jakości”, aby można je było oferować do sprzedaży w Google Play. Ponadto, z powodu rzekomych ograniczeń technicznych, Google nie zastępuje skanów wersjami o wyższej jakości, które mogą być dostarczane przez wydawców.

Projekt jest przedmiotem pozwu Authors Guild przeciwko Google , złożonego w 2005 r. i orzeczonego na korzyść Google w 2013 r., a następnie w postępowaniu odwoławczym w 2015 r.

Właściciele praw autorskich mogą ubiegać się o prawa do zeskanowanej książki i udostępnić ją do podglądu lub pełnego widoku (przenosząc ją na swoje konto programu partnerskiego) lub poprosić Google o uniemożliwienie wyszukiwania tekstu książki.

Liczba instytucji uczestniczących w Bibliotecznym Projekcie wzrosła od początku jego istnienia.

Początkowi partnerzy

Informacja o projekcie w Bibliotece Uniwersytetu Michigan
  • Harvard University , Harvard University Library
    Harvard University Library i Google prowadziły pilotaż przez cały 2005 r. Projekt był kontynuowany w celu zwiększenia dostępu online do zasobów Biblioteki Uniwersytetu Harvarda, która obejmuje ponad 15,8 mln woluminów. Chociaż fizyczny dostęp do materiałów bibliotecznych Harvardu jest ogólnie ograniczony do obecnych studentów, wykładowców i badaczy z Harvardu lub naukowców, którzy mogą przyjechać do Cambridge, projekt Harvard-Google został zaprojektowany tak, aby umożliwić zarówno członkom społeczności Harvarda, jak i użytkownikom na całym świecie odkrywanie prace w kolekcji Harvarda.
  • University of Michigan , University of Michigan Library
Do marca 2012 r. zeskanowano 5,5 miliona woluminów.

Dodatkowi partnerzy

Inni partnerzy instytucjonalni dołączyli do projektu od pierwszego ogłoszenia partnerstwa:

Partnerstwo dotyczyło digitalizacji kolekcji latynoamerykańskiej biblioteki – około pół miliona woluminów.
Do marca 2012 r. zeskanowano około 600 000 woluminów.

Historia

2002 : Grupa członków zespołu Google oficjalnie rozpoczyna „tajny projekt 'książek'”. Założyciele Google, Sergey Brin i Larry Page wpadli na pomysł, który później przekształcił się w Google Books, będąc jeszcze absolwentami Uniwersytetu Stanford w 1996 roku. Strona historii w witrynie Google Books opisuje ich początkową wizję tego projektu: „w przyszłym świecie, w którym ogromna kolekcje książek są zdigitalizowane, ludzie używalibyprzeszukiwacza sieci ” do indeksowania treści książek i analizowania powiązań między nimi, określając trafność i użyteczność danej książki poprzez śledzenie liczby i jakości cytowań z innych książek”. Zespół ten odwiedził strony niektórych większych przedsięwzięć digitalizacyjnych w tamtym czasie, w tym Biblioteki Kongresu Amerykańskiego Projektu Pamięci , Projektu Gutenberg i Biblioteki Uniwersalnej, aby dowiedzieć się, jak one działają, a także Uniwersytet Michigan, alma mater Page, oraz bazę dla takich projektów digitalizacyjnych jak JSTOR i Making of America. W rozmowie z ówczesną rektor uniwersytetu Mary Sue Coleman , gdy Page dowiedział się, że obecne szacunki uniwersytetu dotyczące skanowania wszystkich tomów biblioteki wynoszą 1000 lat, Page podobno powiedział Colemanowi, że „wierzy, że Google może pomóc w osiągnięciu tego celu w ciągu sześciu”. "

2003 : Zespół pracuje nad opracowaniem szybkiego procesu skanowania, a także oprogramowania do rozwiązywania problemów związanych z nieparzystymi rozmiarami czcionek, nietypowymi czcionkami i „innymi nieoczekiwanymi osobliwościami”.

Grudzień 2004 : Google zasygnalizował rozszerzenie swojej inicjatywy Google Print znanej jako Google Print Library Project. Google ogłosiło współpracę z kilkoma znanymi bibliotekami uniwersyteckimi i publicznymi, w tym z University of Michigan , Harvard ( Harvard University Library ), Stanford ( Green Library ), Oxford ( Bodleian Library ) i New York Public Library . Według informacji prasowych i bibliotekarzy uniwersyteckich firma Google planowała zdigitalizować i udostępnić za pośrednictwem usługi Książki Google około 15 milionów woluminów w ciągu dekady. Ogłoszenie wkrótce wywołało kontrowersje, ponieważ stowarzyszenia wydawców i autorów zakwestionowały plany Google dotyczące digitalizacji nie tylko książek znajdujących się w domenie publicznej, ale także tytułów nadal objętych prawami autorskimi.

Wrzesień – październik 2005 : Dwa procesy sądowe przeciwko Google zarzucają firmie naruszenie praw autorskich i niewypłacanie odpowiednich rekompensat autorom i wydawcom. Jeden to pozew zbiorowy w imieniu autorów (Authors Guild v. Google, 20 września 2005 r.), a drugi to pozew cywilny wniesiony przez pięciu dużych wydawców i Association of American Publishers . ( McGraw Hill przeciwko Google , 19 października 2005 r.)

Listopad 2005 : Google zmienił nazwę tej usługi z Google Print na Google Book Search. Jej program umożliwiający wydawcom i autorom włączanie ich książek do serwisu został przemianowany na Program Partnerski Książek Google, a partnerstwo z bibliotekami na Projekt Biblioteczny Książek Google .

2006 : Google dodał przycisk „pobierz plik pdf” do wszystkich swoich książek będących własnością publiczną, które nie są objęte prawami autorskimi. Dodano również nowy interfejs przeglądania oraz nowe strony „O tej książce”.

Sierpień 2006 : University of California System ogłosił, że dołączy do projektu digitalizacji książek. Obejmuje to część z 34 milionów woluminów w około 100 bibliotekach zarządzanych przez System.

Wrzesień 2006 : Uniwersytet Complutense w Madrycie stał się pierwszą hiszpańskojęzyczną biblioteką, która dołączyła do projektu bibliotecznego Google Books Library Project.

Październik 2006 : Uniwersytet Wisconsin-Madison ogłosił, że dołączy do projektu digitalizacji Book Search wraz z Biblioteką Towarzystwa Historycznego Wisconsin . Łącznie biblioteki mają 7,2 mln zbiorów.

Listopad 2006 : Do projektu dołączył Uniwersytet Wirginii . Jej biblioteki zawierają ponad pięć milionów woluminów i ponad 17 milionów rękopisów, rzadkich książek i archiwów.

Styczeń 2007 : Uniwersytet Teksasu w Austin ogłosił, że dołączy do projektu digitalizacji Book Search. Co najmniej milion tomów zostanie zdigitalizowanych z 13 lokalizacji bibliotecznych uniwersytetu.

Marzec 2007 : Bawarska Biblioteka Państwowa ogłosiła partnerstwo z Google w celu przeskanowania ponad miliona dzieł należących do domeny publicznej i wyczerpanych nakładem w języku niemieckim, angielskim, francuskim, włoskim, łacińskim i hiszpańskim.

Maj 2007 : Google oraz Kantonalna i Uniwersytecka Biblioteka Lozanny ogłosiły partnerstwo w zakresie projektu digitalizacji książek .

Maj 2007 : Biblioteka Boekentoren Uniwersytetu w Gandawie ogłosiła, że ​​będzie uczestniczyć wraz z Google w digitalizacji i udostępnianiu online wersji zdigitalizowanych XIX-wiecznych książek w językach francuskim i holenderskim.

Maj 2007: Uniwersytet Mysore ogłasza, że ​​Google zdigitalizuje ponad 800 000 książek i rękopisów – w tym około 100 000 rękopisów napisanych w sanskrycie lub kannada zarówno na papierze, jak i na liściach palmowych.

Czerwiec 2007 : Komitet ds. Współpracy Instytucjonalnej (przemianowany na Big Ten Academic Alliance w 2016 r.) ogłosił, że jego dwanaście bibliotek członkowskich będzie uczestniczyć w skanowaniu 10 milionów książek w ciągu najbliższych sześciu lat.

Lipiec 2007 : Keio University został pierwszym partnerem bibliotecznym Google w Japonii, ogłaszając, że zdigitalizuje co najmniej 120 000 książek należących do domeny publicznej.

Sierpień 2007 : Google ogłosił, że zdigitalizuje do 500 000 obiektów z Biblioteki Uniwersytetu Cornell, zarówno chronionych prawami autorskimi, jak i znajdujących się w domenie publicznej . Google dostarczyłby również cyfrową kopię wszystkich zeskanowanych prac, aby włączyć je do własnego systemu bibliotecznego uniwersytetu.

Wrzesień 2007 : firma Google dodała funkcję umożliwiającą użytkownikom udostępnianie fragmentów książek znajdujących się w domenie publicznej. Fragmenty mogą wyglądać dokładnie tak samo, jak na skanie książki lub jako zwykły tekst.

Wrzesień 2007 : firma Google wprowadziła na rynek nową funkcję o nazwie „Moja biblioteka”, która umożliwia użytkownikom tworzenie osobistych dostosowanych bibliotek, wybór książek, które mogą oznaczać etykietami, recenzować, oceniać lub wyszukiwać w pełnym tekście.

Grudzień 2007 : Uniwersytet Columbia został dodany jako partner w digitalizacji dzieł należących do domeny publicznej.

Maj 2008 : Microsoft zrezygnował i planował zakończyć swój projekt skanowania , który osiągnął 750 000 książek i 80 milionów artykułów w czasopismach.

Październik 2008 : Po dwóch latach negocjacji między branżą wydawniczą a Google osiągnięto ugodę . Google zgodził się wypłacić autorom i wydawcom wynagrodzenie w zamian za prawo do publicznego udostępniania milionów książek.

Październik 2008 : Wspólne repozytorium cyfrowe HathiTrust (później znane jako Biblioteka Cyfrowa HathiTrust) zostaje uruchomione wspólnie przez Komitet ds. Współpracy Instytucjonalnej i 11 bibliotek uniwersyteckich w systemie Uniwersytetu Kalifornijskiego , z których wszystkie były bibliotekami partnerskimi Google, aby do archiwizowania i udostępniania akademickiego książek ze swoich zbiorów zeskanowanych przez Google i inne.

Listopad 2008 : Google osiągnął 7 milionów księgozbiorów dla pozycji zeskanowanych przez Google i ich partnerów wydawniczych. 1 milion było w trybie pełnego podglądu, a 1 milion było w pełni widocznymi i dostępnymi do pobrania dziełami z domeny publicznej. O pięć milionów były wyczerpany .

Grudzień 2008 : firma Google ogłosiła włączenie czasopism do serwisu Książki Google. Tytuły obejmują New York Magazine , Ebony i Popular Mechanics

Luty 2009 : Google uruchomiło mobilną wersję Google Book Search, która umożliwia użytkownikom iPhone'ów i telefonów z systemem Android czytanie ponad 1,5 miliona dzieł należących do domeny publicznej w Stanach Zjednoczonych (i ponad 500 000 poza USA) za pomocą przeglądarki mobilnej. Zamiast obrazów stron wyświetlany jest zwykły tekst książki.

Maj 2009 : Na dorocznej konwencji BookExpo w Nowym Jorku firma Google zasygnalizowała zamiar wprowadzenia programu, który umożliwiłby wydawcom sprzedaż cyfrowych wersji ich najnowszych książek bezpośrednio konsumentom za pośrednictwem Google.

Grudzień 2009 : Francuski sąd zamknął skanowanie książek chronionych prawem autorskim opublikowanych we Francji, twierdząc, że narusza to prawa autorskie. Była to pierwsza poważna strata prawna projektu skanowania.

Kwiecień 2010 : Artyści wizualni nie byli uwzględnieni w poprzednim procesie i ugodzie, są grupami powodów w innym procesie i twierdzą, że zamierzają zbadać coś więcej niż tylko Google Books. „Nowe pozew zbiorowy”, czytamy w oświadczeniu, „wykracza poza projekt biblioteczny Google i obejmuje inne systematyczne i wszechobecne naruszenia praw fotografów, ilustratorów i innych artystów wizualnych”.

Maj 2010 : Poinformowano, że Google uruchomi księgarnię cyfrową o nazwie Google Editions . Konkuruje z Amazonem, Barnes & Noble, Apple i innymi sprzedawcami książek elektronicznych z własnym sklepem z e-bookami. W przeciwieństwie do innych, Google Editions byłoby całkowicie online i nie wymagałoby konkretnego urządzenia (takiego jak Kindle, Nook lub iPad).

Czerwiec 2010 : Google przekazał 12 milionów zeskanowanych książek.

Sierpień 2010 : ogłoszono, że Google zamierza przeskanować wszystkie znane istniejące 129 864 880 książek w ciągu dekady, co daje łącznie ponad 4 miliardy stron cyfrowych i łącznie 2 biliony słów.

Grudzień 2010 : e-Booki Google (Google Editions) zostały wprowadzone na rynek w USA.

Grudzień 2010 : Google uruchomił przeglądarkę Ngram, która zbiera i przedstawia dane na temat użycia słów w swojej kolekcji książek.

Marzec 2011 : Sędzia federalny odrzucił ugodę zawartą między branżą wydawniczą a Google.

Marzec 2012 : Google przekazał 20 milionów zeskanowanych książek.

Marzec 2012 : Google zawarło ugodę z wydawcami.

Styczeń 2013 : Film dokumentalny Google and the World Brain został pokazany na Sundance Film Festival .

Listopad 2013 : Wyrok w sprawie Authors Guild przeciwko Google , amerykański sędzia okręgowy Denny Chin staje po stronie Google, powołując się na dozwolony użytek. Autorzy powiedzieli, że się odwołają.

Październik 2015 : sąd apelacyjny stanął po stronie Google, oświadczając, że Google nie naruszyło praw autorskich. Według New York Times, Google zeskanował ponad 25 milionów książek.

Kwiecień 2016 : Sąd Najwyższy Stanów Zjednoczonych odmówił rozpatrzenia odwołania Gildii Autorów, co oznacza, że ​​decyzja sądu niższej instancji została utrzymana, a Google będzie mógł skanować książki biblioteczne i wyświetlać fragmenty w wynikach wyszukiwania bez naruszania prawa.

Status

Firma Google była dość tajemnicza, jeśli chodzi o swoje plany dotyczące przyszłości projektu Google Books. Operacje skanowania spowalniały od co najmniej 2012 r., co potwierdzili bibliotekarze z kilku instytucji partnerskich Google. Na University of Wisconsin tempo spadło do mniej niż połowy tego, co było w 2006 roku. Bibliotekarze twierdzą jednak, że malejące tempo może być naturalnym skutkiem dojrzewania projektu – początkowo stosy książek zostały całkowicie zajęte skanowanie, podczas gdy teraz trzeba było brać pod uwagę tylko tytuły, które nie zostały jeszcze zeskanowane. Własna strona osi czasu Google Books nie wspominała o niczym po 2007 roku, nawet w 2017 roku, a blog Google Books został połączony z blogiem Google Search w 2012 roku.

Pomimo wygrania trwającego dekadę sporu sądowego w 2017 r., The Atlantic powiedział, że Google „prawie zamknął operację skanowania”. W kwietniu 2017 r. Wired poinformował, że nad projektem pracuje tylko kilku pracowników Google, a nowe książki są nadal skanowane, ale w znacznie niższym tempie. Skomentował, że trwająca dekada batalia prawna spowodowała, że ​​Google stracił swoje ambicje.

Zagadnienia prawne

W ramach projektu książki biblioteczne były digitalizowane w sposób dość bezkrytyczny, niezależnie od statusu praw autorskich, co doprowadziło do wielu procesów sądowych przeciwko Google. Do końca 2008 r. Google podobno zdigitalizowało ponad siedem milionów książek, z których tylko około milion było dziełami w domenie publicznej. Z pozostałych jeden milion podlegał prawu autorskiemu i został wydrukowany, a pięć milionów podlegało prawu autorskiemu, ale nakład został wyczerpany. W 2005 roku grupa autorów i wydawców wniosła pozew zbiorowy przeciwko Google o naruszenie praw autorskich do dzieł. Google argumentował, że zachowuje „dzieła osierocone” – książki nadal objęte prawami autorskimi, ale których posiadaczy praw autorskich nie można znaleźć.

W 2005 r. Stowarzyszenie Autorów i Stowarzyszenie Wydawców Amerykańskich osobno pozwało Google za projekt książki, powołując się na „masowe naruszenie praw autorskich ”. Google odpowiedział, że jego projekt reprezentuje dozwolony użytek i jest cyfrowym odpowiednikiem katalogu kartkowego, w którym zindeksowane jest każde słowo w publikacji. Pozwy sądowe zostały skonsolidowane i ostatecznie zaproponowano ugodę . Ugoda spotkała się z poważną krytyką z wielu różnych powodów, w tym z zakresu prawa antymonopolowego, prywatności i nieadekwatności proponowanych klas autorów i wydawców. Ugoda została ostatecznie odrzucona, a wydawcy wkrótce porozumieli się z Google. Cech Autorów kontynuował swoją sprawę i w 2011 roku proponowana przez nich klasa została certyfikowana . Google odwołał się od tej decyzji, z liczbą Amici dochodzeniu do nieadekwatność klasy , a drugi obwód odrzucił certyfikat klasy w lipcu 2013 roku, przekazując sprawę do Sądu Rejonowego dla rozpatrzenia Google dozwolonego użytku obrony.

W 2015 r. Authors Guild złożyło kolejne odwołanie przeciwko Google, które ma zostać rozpatrzone przez 2. Sąd Apelacyjny Stanów Zjednoczonych w Nowym Jorku. Google jednogłośnie wygrało sprawę, argumentując, że nie pokazuje ludziom pełnych tekstów, ale fragmenty, i nie pozwala ludziom nielegalnie czytać książki. W raporcie sądy stwierdziły, że nie naruszają praw autorskich, ponieważ są chronione klauzulą ​​dozwolonego użytku.

Authors Guild próbował ponownie w 2016 roku odwołać się od tej decyzji i tym razem wzięło swoją sprawę do rozpatrzenia przez Sąd Najwyższy. Sprawa została odrzucona, pozostawiając nienaruszoną decyzję Drugiego Okręgu, co oznacza, że ​​Google nie naruszyło praw autorskich. Ta sprawa stworzyła również precedens dla innych podobnych spraw w odniesieniu do przepisów dotyczących dozwolonego użytku, ponieważ doprecyzowała prawo i je rozszerzyła. Takie wyjaśnienie dotyczy innych projektów skanowania podobnych do Google.

Inne procesy sądowe poszły w ślady Gildii Autorów. W 2006 r. wycofano złożony wcześniej pozew niemiecki. W czerwcu 2006 r. Hervé de la Martinière, francuski wydawca znany jako La Martinière i Éditions du Seuil , ogłosił zamiar pozwania Google France. W 2009 roku paryski sąd cywilny przyznał 300 000 EUR (około 430 000 USD ) odszkodowania i odsetek oraz nakazał Google płacenie 10 000 EUR dziennie, dopóki nie usunie książek wydawcy ze swojej bazy danych. Sąd napisał, że „Google naruszył autorskie prawa autorskie, w pełni reprodukując i udostępniając” książki, które Seuil posiada bez jego zgody, oraz że Google „dopuściło się naruszenia praw autorskich, które jest szkodliwe dla wydawców”. Google powiedział, że będzie się odwoływać. Syndicat National de l'Edition, który przyłączył się do pozwu, powiedział, że Google przeskanował około 100 000 francuskich dzieł objętych prawami autorskimi.

W grudniu 2009 roku chińska pisarka Mian Mian złożyła pozew cywilny o 8900 dolarów przeciwko Google za zeskanowanie jej powieści Acid Lovers . To pierwszy taki pozew przeciwko Google w Chinach. Ponadto w listopadzie tego samego roku Chińskie Towarzystwo Prawa Autorskiego (CWWCS) oskarżyło Google o zeskanowanie 18 000 książek 570 chińskich pisarzy bez zezwolenia. Google zgodził się 20 listopada dostarczyć listę chińskich książek, które zeskanował, ale firma odmówiła przyznania się do „naruszenia” praw autorskich.

W marcu 2007 r. Thomas Rubin, zastępca radcy prawnego ds. praw autorskich, znaków towarowych i tajemnic handlowych w firmie Microsoft, oskarżył Google o naruszenie prawa autorskiego w ramach usługi wyszukiwania książek. Rubin szczególnie skrytykował politykę Google polegającą na swobodnym kopiowaniu wszelkich prac, dopóki właściciel praw autorskich nie powiadomi o tym zaprzestania.

Licencjonowanie przez Google dzieł należących do domeny publicznej jest również niepokojące ze względu na stosowanie w książkach technik cyfrowego znakowania wodnego . Niektóre opublikowane dzieła należące do domeny publicznej, takie jak wszystkie dzieła stworzone przez rząd federalny Stanów Zjednoczonych , są nadal traktowane jak inne dzieła objęte prawami autorskimi i dlatego są zablokowane po 1922 roku.

Podobne projekty

  • Projekt Gutenberg to wysiłek wolontariuszy mający na celu digitalizację i archiwizację dzieł kultury, aby „zachęcać do tworzenia i dystrybucji e-książek”. Została założona w 1971 roku przez Michaela S. Harta i jest najstarszą biblioteką cyfrową. Na dzień 3 października 2015 r. Projekt Gutenberg osiągnął w swojej kolekcji 50 000 egzemplarzy.
  • Internet Archive to organizacja non-profit, która codziennie digitalizuje ponad 1000 książek, a także kopiuje książki z Google Books i innych źródeł. Według stanu na maj 2011 r. w serwisie znajdowało się ponad 2,8 miliona książek należących do domeny publicznej, czyli więcej niż około 1 milion książek należących do domeny publicznej w serwisie Google Books. Otwarta Biblioteka , siostrzany projekt Archiwum Internetowego, wypożycza 80 000 zeskanowanych i zakupionych komercyjnych e-booków odwiedzającym 150 bibliotek.
  • HathiTrust prowadzi Bibliotekę Cyfrową HathiTrust od 13 października 2008 r., która przechowuje i zapewnia dostęp do materiałów zeskanowanych przez Google, niektórych książek z archiwum internetowego i niektórych zeskanowanych lokalnie przez instytucje partnerskie. Według stanu na maj 2010 r. obejmuje około 6 milionów woluminów, z czego ponad 1 milion jest własnością publiczną (przynajmniej w USA).
  • ACLS Humanities E-Book , internetowy zbiór ponad 5400 wysokiej jakości książek z zakresu nauk humanistycznych i pokrewnych nauk społecznych, dostępny poprzez subskrypcję instytucjonalną.
  • Microsoft sfinansował skanowanie 300 000 książek w celu stworzenia Live Search Books pod koniec 2006 roku. Trwało to do maja 2008 roku, kiedy projekt został porzucony, a książki zostały bezpłatnie udostępnione w Internet Archive.
  • Narodowa Biblioteka Cyfrowa Indiach (NDLI) to projekt, w ramach Ministerstwa Rozwoju Zasobów Ludzkich w Indiach. Celem jest zintegrowanie kilku krajowych i międzynarodowych bibliotek cyfrowych w jednym portalu internetowym. NDLI zapewnia bezpłatny dostęp do wielu książek w języku angielskim i językach indyjskich.
  • Europeana łączy się z około 10 milionami obiektów cyfrowych na rok 2010, w tym z materiałami wideo, zdjęciami, obrazami, dźwiękami, mapami, rękopisami, książkami drukowanymi i gazetami z ostatnich 2000 lat europejskiej historii z ponad 1000 archiwów w Unii Europejskiej.
  • Gallica z Francuskiej Biblioteki Narodowej zawiera linki do około 4 000 000 zdigitalizowanych książek, gazet, rękopisów, map i rysunków itp. Utworzona w 1997 r. biblioteka cyfrowa stale się powiększa w tempie około 5000 nowych dokumentów miesięcznie. Od końca 2008 roku większość nowych zeskanowanych dokumentów jest dostępna w formatach graficznych i tekstowych. Większość z tych dokumentów jest napisana po francusku.
  • Wikiźródła
  • Biegacze

Zobacz też

Bibliografia

Dalsza lektura

  • Hoffmann, Anna Lauren (2016). „Książki, biblioteki i szacunek dla siebie Google: sprawiedliwość informacyjna poza dystrybucją”. Kwartalnik Biblioteczny . 86 : 76-92. doi : 10.1086/684141 . S2CID  146482065 .
  • Jeanneney, Jean-Noel (2008). Google i mit uniwersalnej wiedzy: widok z Europy . Chicago, IL: University of Chicago Press.

Zewnętrzne linki