archiwum.dzisiaj - archive.today

archiwum.dzisiaj
Archive.is-Screenshot.png
Zrzut ekranu z archive.today
Rodzaj strony
Archiwizacja internetowa
Dostępne w Wielojęzyczny
URL
Handlowy tak
Rejestracja Nie
Wystrzelony 16 maja 2012 ; 9 lat temu ( 2012-05-16 )

archive.today (dawniej archive.is ) to witryna archiwum, która przechowuje zrzuty stron internetowych. Pobiera jedną stronę na raz, podobnie jak WebCite , każda mniejsza niż 50 MB, ale z obsługą witryn z dużą ilością JavaScript , takich jak Google Maps i progresywnych aplikacji internetowych, takich jak Twitter .

Archive.today rejestruje jednocześnie dwie różne „migawki” strony internetowej. Jedną z nich jest „Strona internetowa”, która zawiera wszelkie funkcjonalne linki na żywo, które są w oryginale. Drugi to „Zrzut ekranu”, który zapewnia statyczną i nieinteraktywną wizualizację reprezentacji.

Cechy

Funkcjonalność

Archive.today może przechwytywać pojedyncze strony w odpowiedzi na wyraźne żądania użytkowników. Od samego początku Archive.Today obsługuje indeksowanie stron z adresami URL zawierającymi obecnie przestarzały fragment hash-bang ( #! ).

Archive.today rejestruje tylko tekst i obrazy, z wyłączeniem XML , RTF , arkuszy kalkulacyjnych ( xls lub ods ) i innych niestatycznych treści. Jednak filmy z niektórych witryn, takich jak Twitter , są zapisywane. Śledzi historię zapisanych migawek, zwracając użytkownikowi prośbę o potwierdzenie przed dodaniem nowej migawki już zapisanego adresu internetowego.

Strony są przechwytywane z 1024 pikselami szerokości przeglądarki. CSS jest konwertowany do wbudowanego CSS, usuwając responsywne projektowanie stron internetowych i selektory, takie jak :hoveri :active. Treść wygenerowana przy użyciu kodu JavaScript podczas procesu indeksowania pojawia się w stanie zamrożonym. Nazwy klas HTML są zachowywane wewnątrz old-class atrybutu .

Po zaznaczeniu tekstu aplet JavaScript generuje fragment adresu URL widoczny na pasku adresu przeglądarki, który automatycznie podświetla tę część tekstu po ponownym odwiedzeniu.

Nie można duplikować stron internetowych z archive.is do web.archive.org jako kopii zapasowej drugiego poziomu , ponieważ archive.is umieszcza wykluczenie dla Wayback Machine i nie zapisuje swoich migawek w formacie WARC. Odwrotność — z web.archive.org do archive.is — jest możliwa, ale kopiowanie zwykle zajmuje więcej czasu niż bezpośrednie przechwycenie. Niektóre witryny internetowe są usuwane z wykazów Internet Archive z mocą wsteczną lub blokowane przed zapisaniem z powodu ich pliku robots.txt , ale Archive.today tego nie używa.

Pasek narzędzi wyszukiwania umożliwia korzystanie z zaawansowanych operatorów słów kluczowych, używając *jako symbolu wieloznacznego . Kilka cudzysłowów kieruje wyszukiwanie do dokładnej sekwencji słów kluczowych znajdujących się w tytule lub treści strony, podczas gdy operator insite ogranicza je do określonej domeny internetowej.

Zarchiwizowana strona internetowa nie może być usunięta bezpośrednio przez żadnego użytkownika Internetu.

Podczas zapisywania dynamicznej listy pole wyszukiwania archive.today pokazuje tylko wynik, który łączy poprzednią i następną sekcję listy (np. 20 linków do strony). Inne zapisane strony internetowe są filtrowane i czasami mogą zostać znalezione przez jedno z ich wystąpień.

Funkcja wyszukiwania jest obsługiwana przez Google CustomSearch. Jeśli nie przyniesie żadnych wyników, archive.is próbuje użyć Yandex Search .

Jeśli strona została już zarchiwizowana, archive.is prosi użytkownika o potwierdzenie archiwizacji nowej wersji, zamiast natychmiastowego jej archiwizowania.

Podczas ładowania strony wyświetlana jest lista adresów URL do poszczególnych elementów strony wśród ich rozmiarów treści, stanów HTTP i typów MIME . Tę listę można wyświetlić tylko podczas procesu indeksowania.

Zarchiwizowane strony można pobrać jako plik ZIP, z wyjątkiem stron zarchiwizowanych od 29 listopada 2019 r., kiedy Archive.Today zmieniło silnik przeglądarki z PhantomJS na Chromium .

Od lipca 2013 archive.today obsługuje interfejs programowania aplikacji (API) Memento Project .

Historia

Archive.today zostało założone w 2012 roku. Witryna pierwotnie nazywała się archive.today, ale w maju 2015 zmieniła główny serwer lustrzany na archive.is.

W styczniu 2019 r. zaczął wycofywać domenę archive.is na rzecz mirrora archive.today.

Dostępność na całym świecie

Australia

W marcu 2019 r. strona została zablokowana na sześć miesięcy przez kilku australijskich dostawców internetu w następstwie strzelaniny w meczecie w Christchurch, próbując ograniczyć rozpowszechnianie materiału filmowego z ataku. Od lipca 2021 r. nadal jest zablokowany w Australii.

Chiny

Według GreatFire .org, archive.today jest blokowana w Chinach od marca 2016 r., archive.li od września 2017 r., a archive.fo od lipca 2018 r.

Finlandia

W dniu 21 lipca 2015 r. operatorzy zablokowali dostęp do usługi ze wszystkich fińskich adresów IP , podając na Twitterze , że zrobili to, aby uniknąć eskalacji sporu, jaki rzekomo mieli z fińskim rządem.

Rosja

W Rosji możliwy jest tylko dostęp HTTP; Połączenia HTTPS są zablokowane.

Zobacz też

Bibliografia

Zewnętrzne linki