Trafność zwrotne - Relevance feedback

Trafność feedback jest cechą niektórych wyszukiwania informacji systemów. Ideą znaczenie zwrotne ma mieć wyniki, które początkowo są zwracane z danego zapytania, aby zebrać użytkownika informacji zwrotnej , a także korzystać z informacji o tym, czy te wyniki są istotne, aby wykonać nowe zapytanie. Możemy skutecznie odróżnić trzy rodzaje sprzężenia zwrotnego: jawne, dorozumiane sprzężenia zwrotnego, a niewidomym lub „pseudo” sprzężenia zwrotnego.

wyraźne sprzężenie zwrotne

Jawne informacje zwrotne uzyskane od asesorów istotnych wskazujących na znaczenie dokumentu pobranego dla zapytania. Ten rodzaj sprzężenia zwrotnego jest zdefiniowany jako jawne tylko wtedy, gdy oceniający (lub innych użytkowników systemu) wiedzą, że sprzężenie zwrotne przewidziane jest interpretowany jako trafności orzeczeń.

Użytkownicy mogą wskazywać na trafność jawnie przy użyciu binarnego lub stopniowane adekwatności systemu. Binary Znaczenie zwrotne wskazuje, że dokument jest albo istotne lub nieistotne dla danego zapytania. Stopniem trafności zwrotne wskazuje trafność dokumentu do zapytania na skalę przy użyciu liczb, liter i opisy (na przykład „nie dotyczy”, „dość istotne”, „istotne” lub „bardzo istotne”). Klasyfikowane Znaczenie może mieć również formę zamawiania kardynalnej dokumentów utworzonych przez osobę oceniającą; to znaczy, że asesor umieszcza dokumenty wyniku ustawić w kolejności malejącej (zazwyczaj) znaczenie. Przykładem tego byłoby SearchWiki Funkcja realizowana przez Google na swojej stronie internetowej wyszukiwarki.

Informacje zwrotne Znaczenie musi być interpolowane z oryginalnego zapytania, aby zwiększyć wydajność pobierania, takie jak znanego algorytmu Rocchio .

Występ metryczny który stał się popularny na całym 2005 mierzyć przydatność rankingu algorytmu opartego na wyraźne znaczenie informacji zwrotnej jest NDCG . Inne środki obejmują precyzję w k i oznaczają średnią precyzję .

niejawny sprzężenia zwrotnego

Niejawny sprzężenia zwrotnego jest wywnioskować z zachowania użytkowników, takie jak zauważając który dokumentuje robią i nie wybrać do oglądania, czas spędzony czas przeglądania dokumentu lub oglądają lub przewijanie działania [1] . Istnieje wiele sygnałów podczas procesu wyszukiwania, które można wykorzystać do niejawny informacji zwrotnych oraz rodzaje informacji, które dostarczają w odpowiedzi

Główne różnice niejawny znaczenie informacji zwrotnej od tego z wyraźną należą [2] :

użytkownik nie ma znaczenia dla oceny korzyści systemu IR, ale tylko zaspokajaniu własnych potrzeb i
użytkownik nie musi być poinformowany, że ich zachowanie (wybrane dokumenty) zostaną wykorzystane jako znaczenie informacji zwrotnej

Przykładem tego jest czas oczekiwania , który jest miarą tego, jak długo użytkownik spędza przeglądając stronę umieszczonego w wyniku wyszukiwania. To jest wskaźnikiem jak dobrze wynik wyszukiwania spotkał się z zamiarem zapytania użytkownika i służy jako mechanizm sprzężenia zwrotnego w celu poprawy wyników wyszukiwania. Innym przykładem jest to Surf Canyon rozszerzenie przeglądarki , które przesuwa wyników wyszukiwania z późniejszych stronach zestawu wyników opartych zarówno na interakcję użytkownika (kliknięcie ikony), a czas spędzony przeglądania strony umieszczonego w wyniku wyszukiwania.

Blind feedback

Pseudo Znaczenie zwrotnego, znaną również jako ślepą znaczenie zwrotnej, zapewnia metodę automatycznej analizy lokalnego. To automatyzuje ręczne część znaczenie zwrotne, tak, że użytkownik dostaje poprawił wydajność bez pobierania dłuższy interakcji. Metoda jest zrobić normalne pobieranie znaleźć początkowy zestaw najbardziej istotnych dokumentów, aby potem zakładać, że top „K” w rankingu dokumenty są istotne, i wreszcie zrobić trafności zwrotne jak wcześniej w ramach tego założenia. Procedura jest:

Weź wyników zwracanych przez początkowe kwerendy jako odpowiednich wyników (tylko z górnej k k wynosi od 10 do 50 w większości eksperymentów).
Wybierz najlepsze 20-30 (liczba orientacyjna) terminy z tych dokumentów z wykorzystaniem na przykład tfidf ciężarami.
Czy Rozszerzenie zapytania dodać je do zapytania, a następnie dopasować zwróconych dokumentów dla tego zapytania i wreszcie powrócić najbardziej odpowiednich dokumentów.

Eksperymenty, takie jak wyniki z systemu Cornell SMART opublikowanym w (Buckley et al.1995), ujawniają polepszenie działania odlewy pomocą pseudo istotności zwrotne w ramach TREC 4 eksperymentów.

Ten automatyczny technika przeważnie działa. Dowody wskazują, że ma ona tendencję do pracy lepiej niż analizy globalnej. Poprzez rozszerzenie zapytania, niektóre istotne dokumenty brakowało w pierwszej rundzie mogą być pobierane w celu poprawy ogólnej wydajności. Jest oczywiste, że efekt ten sposób silnie zależy od jakości wybranych kategoriach ekspansji. Stwierdzono w celu poprawy wydajności w zadaniu TREC ad hoc. Ale to nie jest bez niebezpieczeństw związanych z automatycznym procesie. Na przykład, jeśli zapytanie jest o kopalniach miedzi i górne kilka dokumentów są o kopalniach w Chile, to nie może być dryf zapytań w kierunku dokumentów w Chile. Ponadto, jeśli słowa dodane do oryginalnego zapytania są niezwiązane z tematem zapytania, jakość pobierania może ulec pogorszeniu, zwłaszcza w poszukiwaniu sieci, gdzie dokumenty internetowe często obejmują wiele różnych tematów. Aby poprawić jakość dylatacyjnych słowa pseudo-znaczenie informacji zwrotnej, pozycyjna Znaczenie feedback dla pseudo-znaczenie zwrotne zostało zaproponowane, aby wybrać spośród zwrotnej Dokumenty te słowa, które skupiają się na temacie zapytań na podstawie pozycji słów dokumentów zwrotnych. Konkretnie, pozycyjny Znaczenie modelu przydziela więcej wagi do słów występujących bliżej do zapytania słowa oparte na intuicji, że słowa bliżej zapytania słowa są bardziej prawdopodobne, aby być związane z tematem zapytania.

Blind feedback automatyzuje ręczne część znaczenie zwrotne i ma tę zaletę, że asesorzy nie są wymagane.

Korzystanie z informacji o trafności

Trafność informacja jest wykorzystywana przy użyciu zawartość odpowiednich dokumentów albo dostosować pod względem wagi w pierwotnym zapytaniu, lub za pomocą tych treści, aby dodać wyrazy do zapytania. Trafność opinia jest często realizowane przy użyciu algorytmu Rocchio .

Referencje

Dalsza lektura

Użyteczność opinii wykład notatek - notatki wykładowe Jimmy Lin, przystosowane od Doug Oard użytkownika
[3] - rozdział od Nowoczesne pobierania informacji
Stefan Büttcher Charles Clarke LA, i Gordon V. Cormack. Wyszukiwania informacji: wdrażanie i ocenę Wyszukiwarki . MIT Press, Cambridge, Mass., 2010.

Languages

In other projects