Klasyczny mono słowo poczucie ujednoznacznienie - Classic monolingual word-sense disambiguation

Klasyczne jednojęzycznych Słowo Sense ujednoznaczniające zadania oceny wykorzystuje WordNet jako inwentarza sens i jest w dużej mierze opiera się na nadzorowane / semi-nadzorowanej klasyfikacji z ręcznie sensownego adnotacjami korpusów:

  • Klasyczny angielski WSD używa Princeton WordNet ponieważ wyczuwają inwentaryzacji i pierwotne wejście klasyfikacja opiera się zwykle na SemCor korpusie.
  • WSD klasyczna dla innych językach używa ich odpowiednich wordnet jako zapasy zmysłowych i poczucie adnotacją korpusów oznakowanego w swoich językach. Często naukowcy będą również wykorzystać na korpusie SemCor i wyrównane bitexts z języka angielskiego jako języka źródłowego

zapasy Sense

Podczas pierwszych warsztatów Senseval inwentarz poczucie HECTOR został przyjęty. Powodem przyjęcia nieznaną wcześniej inwentaryzacji sens głównie w celu uniknięcia stosowania popularnych zmysłów drobnoziarnistych słowa (takie jak WordNet), co może sprawić, że eksperymenty nieuczciwy lub tendencyjne. Jednak ze względu na brak pokrycia takich zapasów, ponieważ w drugim warsztacie Senseval inwentarz poczucie WordNet został przyjęty. Ćwiczenia WSD wymagać słownika, aby określić sens wyrazu, które mają być ujednoznacznione i corpus danych językowych być ujednoznacznione. WordNet jest najpopularniejszym przykładem inwentaryzacji sens. Powodem przyjęcia bazy HECTOR podczas Senseval-1 było to, że inwentaryzacja WordNet już publicznie dostępny.

Opis zadania

Porównanie metod można podzielić na 2 grupy według ilości słowy test. Różnica polega na wysokości analizy i przetwarzania:

  • All-słowa zadanie zakłada ujednoznaczniania wszystkie słowa tekstu
  • Próbkę słownikowa polega ujednoznaczniania pewne wcześniej wybranych docelowych słowa.

Zakłada się, że pierwsza z nich jest bardziej realistyczna ocena, chociaż z bardzo żmudnych testów wyników. Początkowo tylko ten ostatni został wykorzystany w ocenie, ale później były została uwzględniona.

Leksykalne organizatorzy próbka miała do wyboru próbek, na których systemy miały być testowane. Krytyka wcześniejsze próby w dziedzinie oceny słownikowa próbie WSD że próbka słownikowa została wybrana zgodnie z kaprysu eksperymentatora (lub pokrywa się z wcześniejszymi wyboru eksperymentatorów). Dla angielskiego Senseval ramka próbek został opracowany w słowa, które zostały sklasyfikowane w zależności od ich częstotliwości (w BNC) i poziomu polisemia (w WordNet). Również problemem włączenie POS-tagging była przedmiotem dyskusji i zdecydowano, że próbki powinny być słowa o znanej części mowy i niektórych indeterminants (dla np. Zadania 15 rzeczownik, czasownik, 13 Zadania 8 przymiotniki i 5 wielomianami).

Dla celów porównawczych, znanych, a zarazem proste, algorytmy wykorzystywane są nazwane podstawowych. Należą do nich różne warianty algorytmu lesk lub najczęstszego sensownego algorytmu.

działania ewaluacyjne

Podczas oceny systemów WSD stosowane są dwa główne mierniki wyników:

  • Precyzja : frakcja zadań systemowych wykonane, że są właściwe
  • Przypomnijmy : część całkowitej przypadkach słów prawidłowo przydzielonych przez system

Jeżeli system sprawia, że zadanie dla każdego słowa, to precyzja i przywołanie są takie same, a można nazwać dokładność . Model ten został przedłużony, aby wziąć pod uwagę, że systemy zwraca zestaw zmysłów z ciężarami dla każdego wystąpienia.

Zobacz też

Referencje