Klasyczny mono słowo poczucie ujednoznacznienie - Classic monolingual word-sense disambiguation
Klasyczne jednojęzycznych Słowo Sense ujednoznaczniające zadania oceny wykorzystuje WordNet jako inwentarza sens i jest w dużej mierze opiera się na nadzorowane / semi-nadzorowanej klasyfikacji z ręcznie sensownego adnotacjami korpusów:
- Klasyczny angielski WSD używa Princeton WordNet ponieważ wyczuwają inwentaryzacji i pierwotne wejście klasyfikacja opiera się zwykle na SemCor korpusie.
- WSD klasyczna dla innych językach używa ich odpowiednich wordnet jako zapasy zmysłowych i poczucie adnotacją korpusów oznakowanego w swoich językach. Często naukowcy będą również wykorzystać na korpusie SemCor i wyrównane bitexts z języka angielskiego jako języka źródłowego
zapasy Sense
Podczas pierwszych warsztatów Senseval inwentarz poczucie HECTOR został przyjęty. Powodem przyjęcia nieznaną wcześniej inwentaryzacji sens głównie w celu uniknięcia stosowania popularnych zmysłów drobnoziarnistych słowa (takie jak WordNet), co może sprawić, że eksperymenty nieuczciwy lub tendencyjne. Jednak ze względu na brak pokrycia takich zapasów, ponieważ w drugim warsztacie Senseval inwentarz poczucie WordNet został przyjęty. Ćwiczenia WSD wymagać słownika, aby określić sens wyrazu, które mają być ujednoznacznione i corpus danych językowych być ujednoznacznione. WordNet jest najpopularniejszym przykładem inwentaryzacji sens. Powodem przyjęcia bazy HECTOR podczas Senseval-1 było to, że inwentaryzacja WordNet już publicznie dostępny.
Opis zadania
Porównanie metod można podzielić na 2 grupy według ilości słowy test. Różnica polega na wysokości analizy i przetwarzania:
- All-słowa zadanie zakłada ujednoznaczniania wszystkie słowa tekstu
- Próbkę słownikowa polega ujednoznaczniania pewne wcześniej wybranych docelowych słowa.
Zakłada się, że pierwsza z nich jest bardziej realistyczna ocena, chociaż z bardzo żmudnych testów wyników. Początkowo tylko ten ostatni został wykorzystany w ocenie, ale później były została uwzględniona.
Leksykalne organizatorzy próbka miała do wyboru próbek, na których systemy miały być testowane. Krytyka wcześniejsze próby w dziedzinie oceny słownikowa próbie WSD że próbka słownikowa została wybrana zgodnie z kaprysu eksperymentatora (lub pokrywa się z wcześniejszymi wyboru eksperymentatorów). Dla angielskiego Senseval ramka próbek został opracowany w słowa, które zostały sklasyfikowane w zależności od ich częstotliwości (w BNC) i poziomu polisemia (w WordNet). Również problemem włączenie POS-tagging była przedmiotem dyskusji i zdecydowano, że próbki powinny być słowa o znanej części mowy i niektórych indeterminants (dla np. Zadania 15 rzeczownik, czasownik, 13 Zadania 8 przymiotniki i 5 wielomianami).
Dla celów porównawczych, znanych, a zarazem proste, algorytmy wykorzystywane są nazwane podstawowych. Należą do nich różne warianty algorytmu lesk lub najczęstszego sensownego algorytmu.
działania ewaluacyjne
Podczas oceny systemów WSD stosowane są dwa główne mierniki wyników:
- Precyzja : frakcja zadań systemowych wykonane, że są właściwe
- Przypomnijmy : część całkowitej przypadkach słów prawidłowo przydzielonych przez system
Jeżeli system sprawia, że zadanie dla każdego słowa, to precyzja i przywołanie są takie same, a można nazwać dokładność . Model ten został przedłużony, aby wziąć pod uwagę, że systemy zwraca zestaw zmysłów z ciężarami dla każdego wystąpienia.