Probabilistyczny model istotności - Probabilistic relevance model

Model probabilistyczny istotności został opracowany przez Stephena E. Robertsona i Karen Spärck Jones jako ramy dla przyszłych modeli probabilistycznych . Jest to formalizm wyszukiwania informacji przydatny do uzyskania funkcji rankingowych używanych przez wyszukiwarki i wyszukiwarki internetowe w celu uszeregowania pasujących dokumentów zgodnie z ich trafnością dla danego zapytania wyszukiwania.

Jest to model teoretyczny szacujący prawdopodobieństwo, że dokument d _j jest istotny dla zapytania q . Model zakłada, że to prawdopodobieństwo trafności zależy od reprezentacji zapytania i dokumentu. Ponadto zakłada, że istnieje część wszystkich dokumentów, która jest preferowana przez użytkownika jako zestaw odpowiedzi na zapytanie q . Taki idealny zestaw odpowiedzi nazywa się R i powinien maksymalizować ogólne prawdopodobieństwo trafności dla tego użytkownika. Przewiduje się, że dokumenty w tym zestawie R są istotne dla zapytania, podczas gdy dokumenty nieobecne w zestawie są nieistotne.

${\ Displaystyle sim (d_ {j}, q) = {\ Frac {P (R | {\ vec {d}} _ {j})} {P ({\ bar {R}} | {\ vec {d }}_{jot})}}}$

Powiązane modele

Istnieją pewne ograniczenia tych ram, którymi należy się zająć poprzez dalszy rozwój:

Nie ma dokładnego oszacowania prawdopodobieństwa pierwszego uruchomienia
Terminy indeksu nie są ważone
Zakłada się, że warunki są wzajemnie niezależne

Aby rozwiązać te i inne problemy, opracowano inne modele na podstawie probabilistycznej struktury relewancji, w tym binarny model niezależności tego samego autora. Najbardziej znaną pochodną tego frameworka jest schemat ważenia Okapi (BM25) wraz z BM25F, jego modyfikacją.

Languages

In other projects

Probabilistyczny model istotności - Probabilistic relevance model

Powiązane modele

Bibliografia