Eksplozja informacji - Information explosion

Informacje eksplozja jest gwałtowny wzrost ilości publikowanych informacji lub danych oraz skutków tej obfitości. Wraz ze wzrostem ilości dostępnych danych problem zarządzania informacją staje się coraz trudniejszy, co może prowadzić do przeciążenia informacjami . Słownik Online Oxford English Dictionary wskazuje użycie tego wyrażenia w artykule New Statesman z marca 1964 roku. New York Times po raz pierwszy użył tego wyrażenia w treści redakcyjnej w artykule Waltera Sullivana z 7 czerwca 1964 r., w którym określił to wyrażenie jako „dużo dyskutowane”. (s.11.) Najwcześniejsze znane użycie tego wyrażenia było w przemówieniu na temat telewizji wygłoszonym przez prezydenta NBC Pata Weavera w Instytucie Praktyków Reklamy w Londynie 27 września 1955 roku. Przemówienie zostało ponownie wyemitowane w stacji radiowej WSUI w Iowa Dzienne Iowan gazeta dwa miesiące później.

Wiele sektorów odnotowuje ten gwałtowny wzrost ilości dostępnych informacji, takich jak opieka zdrowotna, supermarkety, a nawet rządy z informacjami o metrykach urodzenia i rejestrach szczepień. Innym sektorem, którego dotyczy to zjawisko, jest dziennikarstwo. Taki zawód, który w przeszłości odpowiadał za rozpowszechnianie informacji, dziś może być przytłumiony przez nadmiar informacji.

Techniki gromadzenia wiedzy z nadmiaru informacji elektronicznych (np. fuzja danych może pomóc w eksploracji danych ) istnieją od lat 70. XX wieku. Inną powszechną techniką radzenia sobie z taką ilością informacji są badania jakościowe . Takie podejścia mają na celu uporządkowanie informacji, syntezę, kategoryzację i usystematyzowanie, aby były bardziej użyteczne i łatwiejsze do wyszukiwania.

Wzory wzrostu

  • Światowa zdolność technologiczna przechowywania informacji wzrosła z 2,6 (optymalnie skompresowanych) eksabajtów w 1986 r. do 15,8 w 1993 r., ponad 54,5 w 2000 r. i do 295 (optymalnie skompresowanych) eksabajtów w 2007 r. Odpowiada to mniej niż jednej płycie CD o pojemności 730 MB. ROM na osobę w 1986 roku (539 MB na osobę), około 4 CD-ROM-y na osobę w 1993 roku, 12 CD-ROM-ów na osobę w 2000 roku i prawie 61 CD-ROM-ów na osobę w 2007 roku. CD-ROM z 2007 roku utworzyłby stos z Ziemi na Księżyc i jedną czwartą tej odległości dalej (o grubości 1,2 mm na CD).
  • Światowa zdolność technologiczna do odbierania informacji za pośrednictwem jednokierunkowych sieci transmisyjnych wynosiła 432 eksabajty (optymalnie skompresowanych) informacji w 1986 r., 715 (optymalnie skompresowanych) eksabajtów w 1993 r., 1200 (optymalnie skompresowanych) eksabajtów w 2000 r. i 1900 w 2007 r.
  • Efektywna światowa zdolność wymiany informacji za pośrednictwem dwukierunkowych sieci telekomunikacyjnych wynosiła 0,281 eksabajtów (optymalnie skompresowanych) informacji w 1986 r., 0,471 w 1993 r., 2,2 w 2000 r. i 65 (optymalnie skompresowanych) eksabajtów w 2007 r.

Nowy parametr, który jest użyty w próbie scharakteryzowania wzrost informacji do określonej osoby, jest dysk pamięci osobę (DSP), który mierzy się megabajtów / osobę (gdzie megabajtów jest 10 6 bajtów jest skrótem MB). Globalny DSP (GDSP) to całkowita ilość miejsca na dysku twardym (w MB) nowych jednostek sprzedanych w danym roku podzielona przez liczbę ludności na świecie w tym roku. Miernik GDSP jest prymitywną miarą tego, ile miejsca na dysku można wykorzystać do zbierania danych dotyczących konkretnej osoby na świecie. W 1983 roku na całym świecie sprzedano milion stałych dysków o szacunkowej łącznej pojemności 90 terabajtów ; Dyski 30 MB miały największy segment rynku. W 1996 roku sprzedano 105 milionów dysków o łącznej pojemności 160 623 terabajtów, z których 1 i 2 gigabajty przewodziły w branży. Przewiduje się, że do 2000 r., z 20 GB dyskiem wiodącym w branży, sprzedaż sztywnych dysków twardych w tym roku wyniesie 2 829 288 terabajtów, osiągając w 1997 r. 34 miliardy dolarów.

Według Latanyi Sweeney istnieją obecnie trzy trendy w gromadzeniu danych:

Typ 1. Rozszerzenie liczby zbieranych pól, zwane trendem „zbieraj więcej”.

Typ 2. Zastąp istniejący zbiór danych zbiorczych zbiorem danych dla konkretnej osoby, znanym jako trend „zbieraj konkretnie”.

Typ 3. Zbierz informacje, rozpoczynając nowe zbieranie danych dotyczących konkretnej osoby, znane jako trend „zbierz to, jeśli możesz”.

Terminy pokrewne

Ponieważ „informacja” w mediach elektronicznych jest często używana jako synonim „danych”, termin „ eksplozja informacji” jest ściśle powiązany z pojęciem zalewu danych (nazywanego również potopem danych ). Czasem używa się również terminu zalew informacji . Wszystko to w zasadzie sprowadza się do stale rosnącej ilości danych elektronicznych wymienianych w jednostce czasu. Świadomość na temat ilości danych, którymi nie można zarządzać, rosła wraz z nadejściem od połowy lat sześćdziesiątych coraz wydajniejszego przetwarzania danych.

Wyzwania

Chociaż obfitość informacji może być korzystna na kilku poziomach, niektóre problemy mogą budzić obawy, takie jak prywatność , wytyczne prawne i etyczne, filtrowanie i dokładność danych. Filtrowanie odnosi się do znajdowania przydatnych informacji w środku tak dużej ilości danych, co wiąże się z pracą analityków danych. Typowym przykładem konieczności filtrowania danych ( eksploracji danych ) jest służba zdrowia , ponieważ w najbliższych latach ma być dostępna EHR ( Elektroniczne Rejestry Zdrowotne ) pacjentów. Mając tak wiele dostępnych informacji, lekarze będą musieli być w stanie zidentyfikować wzorce i wybrać ważne dane do diagnozy pacjenta. Z drugiej strony, zdaniem niektórych ekspertów, posiadanie tak dużej ilości danych publicznych utrudnia dostarczanie danych faktycznie anonimowych. Kolejnym punktem, który należy wziąć pod uwagę, są wytyczne prawne i etyczne, które dotyczą tego, kto będzie właścicielem danych oraz jak często jest zobowiązany je udostępniać i na jak długo. Przy tak wielu źródłach danych kolejnym problemem będzie ich dokładność. Niezaufane źródło może zostać zakwestionowane przez innych, zamawiając nowy zestaw danych, powodując powtórzenie się informacji. Według Edwarda Hutha kolejnym problemem jest dostępność i koszt takich informacji. Wskaźnik dostępności można poprawić, zmniejszając koszty lub zwiększając użyteczność informacji. Redukcją kosztów, zdaniem autora, mogłyby dokonać stowarzyszenia, które powinny ocenić, które informacje były istotne i zebrać je w bardziej zorganizowany sposób.

Serwery WWW

W sierpniu 2005 r. istniało ponad 70 milionów serwerów WWW . Według stanu na wrzesień 2007 istniało ponad 135 milionów serwerów WWW.

Blogi

Według Technorati , liczba blogów podwaja się co 6 miesięcy, w sumie 35,3 miliona blogów w kwietniu 2006 roku. Jest to przykład wczesnych etapów rozwoju logistycznego , gdzie wzrost jest w przybliżeniu wykładniczy , ponieważ blogi są niedawną innowacją. Gdy liczba blogów zbliża się do liczby potencjalnych producentów (ludzi), następuje nasycenie, wzrost spada, a liczba blogów ostatecznie się stabilizuje.

Zobacz też

Bibliografia

Linki zewnętrzne