Informacje kontradyktoryjności odzyskiwanie - Adversarial information retrieval

Informacje kontradyktoryjności pobierania ( kontradyktoryjności IR ) jest tematem pozyskiwania informacji związanych ze strategiami dla pracy ze źródłem danych, z których część została ona manipulowana złośliwie. Zadania mogą obejmować gromadzenie, indeksowanie, filtrowania, wyszukiwania i ranking informacje z takiego źródła danych. Antagonistyczna IR obejmuje badanie metod, w celu wykrycia, izolowanie i pokonania takiej manipulacji.

W sieci, dominującą formą takiej manipulacji jest spamowanie wyszukiwarek (znany również jako spamdexing), która polega na zastosowaniu różnych technik, aby zakłócić działanie wyszukiwarek internetowych , zazwyczaj dla korzyści finansowych. Przykłady spamdexing są łącza bombardowanie , komentarz lub spam wywołującej , blogi spam (splogs), złośliwy tagowania. Reverse engineering z algorytmów rankingowych , reklamy blokowania , fałszywe kliknięcia i filtrowanie treści internetowych mogą również zostać uznane formy kontradyktoryjności manipulacji danymi .

Działania mające na celu zatruwają wodę użytecznych danych zrobić wyszukiwarek mniej przydatna dla użytkowników. Jeśli wyszukiwarki są bardziej wykluczające oni ryzykować coraz bardziej jak katalogi i mniej dynamiczny.

tematy

Tematy dotyczące spamu internetowego (Spamdexing):

Inne tematy:

Historia

Termin „informacja kontradyktoryjności odzyskiwanie” został pierwszy użył w 2000 roku przez Andrei Broder (wówczas główny naukowiec w Alta Vista ) podczas internetowej sesji plenarnej Pod TREC konferencji -9.

Zobacz też

Referencje

Linki zewnętrzne

  • AIRWeb : cykl warsztatów dotyczących kontradyktoryjności wyszukiwania informacji w sieci
  • Web Spam Wyzwanie : konkurs dla naukowców na wykrywaniu Web Spam
  • Web Spam Zbiory danych : zestawy danych dla badań nad wykrywaniem Web Spam