Probabilistyczny model istotności - Probabilistic relevance model

Model probabilistyczny istotności został opracowany przez Stephena E. Robertsona i Karen Spärck Jones jako ramy dla przyszłych modeli probabilistycznych . Jest to formalizm wyszukiwania informacji przydatny do uzyskania funkcji rankingowych używanych przez wyszukiwarki i wyszukiwarki internetowe w celu uszeregowania pasujących dokumentów zgodnie z ich trafnością dla danego zapytania wyszukiwania.

Jest to model teoretyczny szacujący prawdopodobieństwo, że dokument d j jest istotny dla zapytania q . Model zakłada, że ​​to prawdopodobieństwo trafności zależy od reprezentacji zapytania i dokumentu. Ponadto zakłada, że ​​istnieje część wszystkich dokumentów, która jest preferowana przez użytkownika jako zestaw odpowiedzi na zapytanie q . Taki idealny zestaw odpowiedzi nazywa się R i powinien maksymalizować ogólne prawdopodobieństwo trafności dla tego użytkownika. Przewiduje się, że dokumenty w tym zestawie R są istotne dla zapytania, podczas gdy dokumenty nieobecne w zestawie są nieistotne.

Powiązane modele

Istnieją pewne ograniczenia tych ram, którymi należy się zająć poprzez dalszy rozwój:

  • Nie ma dokładnego oszacowania prawdopodobieństwa pierwszego uruchomienia
  • Terminy indeksu nie są ważone
  • Zakłada się, że warunki są wzajemnie niezależne

Aby rozwiązać te i inne problemy, opracowano inne modele na podstawie probabilistycznej struktury relewancji, w tym binarny model niezależności tego samego autora. Najbardziej znaną pochodną tego frameworka jest schemat ważenia Okapi (BM25) wraz z BM25F, jego modyfikacją.

Bibliografia