Wyszukiwanie informacji człowiek – komputer - Human–computer information retrieval

Wyszukiwanie informacji człowiek-komputer ( HCIR ) to badanie i inżynieria technik wyszukiwania informacji , które wprowadzają ludzką inteligencję do procesu wyszukiwania . Łączy obszary interakcji człowiek-komputer (HCI) i wyszukiwania informacji (IR) i tworzy systemy, które usprawniają wyszukiwanie, biorąc pod uwagę kontekst człowieka lub poprzez wieloetapowy proces wyszukiwania, który zapewnia możliwość uzyskania informacji zwrotnej od ludzi.

Historia

Ten termin „ wyszukiwanie informacji o człowieku i komputerze” został ukuty przez Gary'ego Marchioniniego w serii wykładów wygłoszonych w latach 2004–2006. Główna teza Marchioniniego brzmi, że „HCIR ma na celu umożliwienie ludziom odkrywania dużych baz informacji, ale wymaga, aby ludzie również brali za to odpowiedzialność kontrolę poprzez wydatkowanie energii poznawczej i fizycznej ”.

W 1996 i 1998 r. Na Uniwersytecie w Glasgow na dwóch warsztatach poświęconych wyszukiwaniu informacji i interakcji człowiek-komputer podjęto próbę zajęcia się nakładaniem się tych dwóch dziedzin. Marchionini zwraca uwagę na wpływ sieci World Wide Web i nagły wzrost umiejętności informacyjnych - zmiany, które były dopiero embrionalne pod koniec lat dziewięćdziesiątych.

Kilka warsztatów dotyczyło przecięcia IR i HCI. Warsztaty na temat poszukiwań eksploracyjnych, zainicjowane przez Laboratorium interakcji człowiek-komputer na Uniwersytecie Maryland w 2005 r., Odbywają się na przemian między Grupą Specjalnych Interesów Stowarzyszenia na rzecz Maszyn Komputerowych ds. Wyszukiwania informacji (SIGIR) i Grupą zainteresowań ds. Interakcji komputer-człowiek (CHI). Również w 2005 roku Europejska Fundacja Nauki przeprowadziła warsztaty eksploracyjne nt. Wyszukiwania informacji w kontekście. Następnie w 2007 roku w Massachusetts Institute of Technology odbyły się pierwsze warsztaty nt. Wyszukiwania informacji o komputerach ludzkich .

Opis

HCIR obejmuje różne aspekty IR i HCI. Obejmuje to wyszukiwanie eksploracyjne , w którym użytkownicy zazwyczaj łączą strategie wyszukiwania i przeglądania, aby wspierać uczenie się i badanie; wyszukiwanie informacji w kontekście (tj. uwzględnianie aspektów użytkownika lub środowiska, które zwykle nie są odzwierciedlone w zapytaniu); oraz interaktywne wyszukiwanie informacji, które Peter Ingwersen definiuje jako „interaktywne procesy komunikacyjne, które zachodzą podczas wyszukiwania informacji poprzez zaangażowanie wszystkich głównych uczestników wyszukiwania informacji (IR), tj. użytkownika, pośrednika i systemu IR”.

Głównym problemem HCIR jest to, aby systemy IR przeznaczone dla użytkowników były wdrażane i oceniane w sposób, który odzwierciedla potrzeby tych użytkowników.

Większość nowoczesnych systemów IR wykorzystuje rankingowy model wyszukiwania, w którym dokumenty są oceniane na podstawie prawdopodobieństwa trafności dokumentu do zapytania. W tym modelu system prezentuje użytkownikowi tylko najwyżej ocenione dokumenty. Systemy te są zwykle oceniane na podstawie ich średniej średniej precyzji w zestawie zapytań porównawczych z organizacji, takich jak Konferencja pobierania tekstu (TREC).

Ze względu na nacisk na wykorzystanie ludzkiej inteligencji w procesie wyszukiwania informacji HCIR wymaga różnych modeli oceny - takiego, który łączy ocenę elementów IR i HCI systemu. Kluczowym obszarem badań HCIR jest ocena tych systemów. Wczesne prace nad interaktywnym wyszukiwaniem informacji, takie jak badanie Juergena Koenemanna i Nicholasa J. Belkina z 1996 r. Nad różnymi poziomami interakcji w celu automatycznego przeformułowania zapytań, wykorzystują standardowe miary IR precyzji i zapamiętywania, ale stosują je do wyników wielu iteracji użytkownika interakcji, a nie pojedynczej odpowiedzi na zapytanie. Inne badania HCIR, takie jak model oceny IIR Pia Borlund, wykorzystują metodologię bardziej przypominającą HCI, koncentrując się na cechach użytkowników, szczegółach projektu eksperymentalnego itp.

Cele

Badacze HCIR postawili następujące cele dotyczące systemu, w którym użytkownik ma większą kontrolę w określaniu odpowiednich wyników.

Systemy powinny

nie tylko dostarczają odpowiednie dokumenty, ale muszą również dostarczać informacje semantyczne wraz z tymi dokumentami
zwiększyć odpowiedzialność użytkownika, a także kontrolę; to znaczy systemy informacyjne wymagają ludzkiego wysiłku intelektualnego
mają elastyczną architekturę, dzięki czemu mogą ewoluować i dostosowywać się do coraz bardziej wymagających i doświadczonych użytkowników
starają się być częścią ekologii informacji osobistych i wspólnych wspomnień oraz narzędzi, a nie odrębnymi, samodzielnymi usługami
wspierać cały cykl życia informacji (od stworzenia do zachowania), a nie tylko fazę rozpowszechniania lub wykorzystywania
wspierać dostrajanie przez użytkowników końcowych, a zwłaszcza przez specjalistów z zakresu informacji, którzy dodają wartość do zasobów informacyjnych
być angażujące i przyjemne w użyciu

Krótko mówiąc, oczekuje się, że systemy wyszukiwania informacji będą działać w sposób, w jaki działają dobre biblioteki. Systemy powinny pomagać użytkownikom w wypełnianiu luki między danymi lub informacjami (w bardzo wąskim, szczegółowym znaczeniu tych terminów) a wiedzą (przetworzone dane lub informacje, które zapewniają kontekst niezbędny do poinformowania następnej iteracji procesu poszukiwania informacji). Oznacza to, że dobre biblioteki dostarczają zarówno informacji, których potrzebuje mecenas, jak i partnera w procesie uczenia się - specjalistę od informacji - aby poruszać się po tych informacjach, nadawać im sens, zachować je i przekształcić w wiedzę (co z kolei tworzy nowe , bardziej świadome potrzeby informacyjne).

Techniki

Techniki związane z HCIR kładą nacisk na przedstawianie informacji, które wykorzystują ludzką inteligencję, aby doprowadzić użytkownika do odpowiednich wyników. Techniki te mają również na celu umożliwienie użytkownikom eksplorowania i analizowania zbioru danych bez ponoszenia kary, tj. Bez ponoszenia niepotrzebnych kosztów czasu, kliknięć myszą lub zmiany kontekstu.

Wiele wyszukiwarek ma funkcje, które wykorzystują techniki HCIR. Sugestie dotyczące pisowni i automatyczne ponowne formułowanie zapytań zapewniają mechanizmy sugerowania potencjalnych ścieżek wyszukiwania, które mogą doprowadzić użytkownika do odpowiednich wyników. Te sugestie są przedstawiane użytkownikowi, oddając kontrolę wyboru i interpretacji w ręce użytkownika.

Wyszukiwanie aspektowe umożliwia użytkownikom hierarchiczną nawigację po informacjach , przechodząc od kategorii do jej podkategorii, ale wybierając kolejność, w jakiej kategorie są prezentowane. Kontrastuje to z tradycyjnymi taksonomiami, w których hierarchia kategorii jest stała i niezmienna. Nawigacja aspektowa , podobnie jak nawigacja taksonomiczna, prowadzi użytkowników, pokazując im dostępne kategorie (lub aspekty), ale nie wymaga od nich przeglądania hierarchii, która może nie być dokładnie dopasowana do ich potrzeb lub sposobu myślenia.

Lookahead zapewnia ogólne podejście do eksploracji bez kar. Na przykład różne aplikacje internetowe wykorzystują AJAX do automatycznego uzupełniania zapytań i sugerowania popularnych wyszukiwań. Innym typowym przykładem lookahead jest sposób, w jaki wyszukiwarki opisują wyniki za pomocą podsumowania informacji o tych wynikach, w tym zarówno informacji statycznych (np. Metadanych o obiektach), jak i „fragmentów” tekstu dokumentu, które są najbardziej odpowiednie dla wyszukiwanych słów pytanie.

Informacje zwrotne dotyczące trafności pozwalają użytkownikom kierować systemem IR poprzez wskazywanie, czy określone wyniki są mniej lub bardziej istotne.

Podsumowanie i analiza pomagają użytkownikom przetrawić wyniki, które pochodzą z zapytania. Podsumowanie w tym miejscu ma na celu objęcie wszelkich środków agregacji lub kompresji wyników zapytania do postaci bardziej przyjaznej dla człowieka. Jedną z takich form podsumowania jest opisane powyżej wyszukiwanie aspektowe. Innym jest grupowanie , które analizuje zbiór dokumentów poprzez grupowanie podobnych lub współwystępujących dokumentów lub terminów. Klastrowanie umożliwia podzielenie wyników na grupy powiązanych dokumentów. Na przykład wyszukiwanie „java” może zwrócić klastry dla języka Java (język programowania) , Java (wyspa) lub Java (kawa) .

Wizualne przedstawienie danych jest również uważane za kluczowy aspekt HCIR. Reprezentacja podsumowania lub analizy może być wyświetlana jako tabele, wykresy lub podsumowania zagregowanych danych. Inne rodzaje wizualizacji informacji, które umożliwiają użytkownikom dostęp do widoków podsumowań wyników wyszukiwania, obejmują chmury znaczników i mapy drzewa .

Powiązane obszary

Bibliografia

^ ^a ^b Marchionini, G. (2006). Toward Human-Computer Retrieval Bulletin, czerwiec / lipiec 2006 Biuletyn American Society for Information Science
^ "Ingwersen, P. (1992). Information Retrieval Interaction. London: Taylor Graham" . Zarchiwizowane od oryginału w dniu 25.11.2007 . Źródło 2007-11-28 .
^ „Grupa robocza Mira (1996). Ramy oceny dla interaktywnych multimedialnych aplikacji do wyszukiwania informacji” . Zarchiwizowane od oryginału w dniu 2008-02-01.
^ Grossman, D. i Frieder, O. (2004). Algorytmy wyszukiwania informacji i heurystyka.
^ Koenemann, J. i Belkin, NJ (1996). Przykład interakcji: badanie zachowania i skuteczności interaktywnego wyszukiwania informacji. W materiałach konferencji SIGCHI nt. Czynnika ludzkiego w systemach komputerowych: wspólna podstawa (Vancouver, Kolumbia Brytyjska, Kanada, 13–18 kwietnia 1996). MJ Tauber, wyd. CHI '96. ACM Press, Nowy Jork, NY, 205-212
^ Borlund, P. (2003). Model oceny IIR: ramy oceny interaktywnych systemów wyszukiwania informacji. Information Research, 8 (3), Przekaz 152
^ White, R., Capra, R., Golovchinsky, G., Kules, B., Smith, C. i Tunkelang, D. (2013). Wprowadzenie do specjalnego wydania dotyczącego wyszukiwania informacji o człowieku i komputerze. Journal of Information Processing and Management 49 (5), 1053-1057
^ Hearst, M. (1999). Interfejsy użytkownika i wizualizacja, rozdział 10, Baeza-Yates, R. i Ribeiro-Neto, B., Modern Information Retrieval.
^ Rocchio, J. (1971). Informacje zwrotne dotyczące znaczenia w wyszukiwaniu informacji. W: Salton, G (red.), The SMART Retrieval System.

Linki zewnętrzne

[march2006-1] Marchionini, G. (2006). Toward Human-Computer Retrieval Bulletin, czerwiec / lipiec 2006 Biuletyn American Society for Information Science

[ingwer1992-2] "Ingwersen, P. (1992). Information Retrieval Interaction. London: Taylor Graham" . Zarchiwizowane od oryginału w dniu 25.11.2007 . Źródło 2007-11-28 .

[3] „Grupa robocza Mira (1996). Ramy oceny dla interaktywnych multimedialnych aplikacji do wyszukiwania informacji” . Zarchiwizowane od oryginału w dniu 2008-02-01.

[4] Grossman, D. i Frieder, O. (2004). Algorytmy wyszukiwania informacji i heurystyka.

[koene1996-5] Koenemann, J. i Belkin, NJ (1996). Przykład interakcji: badanie zachowania i skuteczności interaktywnego wyszukiwania informacji. W materiałach konferencji SIGCHI nt. Czynnika ludzkiego w systemach komputerowych: wspólna podstawa (Vancouver, Kolumbia Brytyjska, Kanada, 13–18 kwietnia 1996). MJ Tauber, wyd. CHI '96. ACM Press, Nowy Jork, NY, 205-212

[borlund2003-6] Borlund, P. (2003). Model oceny IIR: ramy oceny interaktywnych systemów wyszukiwania informacji. Information Research, 8 (3), Przekaz 152

[ipm2013-7] White, R., Capra, R., Golovchinsky, G., Kules, B., Smith, C. i Tunkelang, D. (2013). Wprowadzenie do specjalnego wydania dotyczącego wyszukiwania informacji o człowieku i komputerze. Journal of Information Processing and Management 49 (5), 1053-1057

[8] Hearst, M. (1999). Interfejsy użytkownika i wizualizacja, rozdział 10, Baeza-Yates, R. i Ribeiro-Neto, B., Modern Information Retrieval.

[9] Rocchio, J. (1971). Informacje zwrotne dotyczące znaczenia w wyszukiwaniu informacji. W: Salton, G (red.), The SMART Retrieval System.

Languages

In other projects