Gerard Salton - Gerard Salton

Gerard Salton
Urodzony ( 08.03.1927 ) 8 marca 1927
Zmarły 28 sierpnia 1995 (28.08.1995) (w wieku 68)
Alma Mater Uniwersytet Harwardzki
Znany z ojciec Information Retrieval
Gerard Salton Award
Kariera naukowa
Pola wyszukiwanie informacji
Instytucje Uniwersytet Cornella
Praca dyplomowa Automatyczny system przetwarzania danych do rozliczania przychodów użyteczności publicznej   (1958)
Doradca doktorancki Howard Aiken
Doktoranci

Gerard A. "Gerry" Salton (8 marca 1927 w Norymberdze - 28 sierpnia 1995), był profesorem informatyki na Uniwersytecie Cornell . Salton był prawdopodobnie czołowym informatykiem pracującym w swoim czasie w dziedzinie wyszukiwania informacji i „ojcem wyszukiwania informacji”. Jego grupa w Cornell opracowała SMART Information Retrieval System , który zainicjował, gdy był na Harvardzie. Był to pierwszy system, w którym do wyszukiwania informacji wykorzystano popularny obecnie model przestrzeni wektorowej.

Salton urodził się jako Gerhard Anton Sahlmann 8 marca 1927 roku w Norymberdze w Niemczech . Uzyskał tytuł licencjata (1950) i magistra (1952) z matematyki na Brooklyn College oraz tytuł doktora. z Harvardu z Matematyki Stosowanej w 1958 r., ostatniego doktoranta Howarda Aikena , i tam wykładał do 1965 r., kiedy to dołączył do Cornell University i był współzałożycielem wydziału informatyki.

Salton był prawdopodobnie najbardziej znany z opracowania szeroko stosowanego obecnie modelu przestrzeni wektorowej do wyszukiwania informacji. W tym modelu zarówno dokumenty, jak i zapytania są reprezentowane jako wektory liczby terminów, a podobieństwo między dokumentem a zapytaniem jest określone przez cosinus między terminem wektor a wektorem dokumentu. W tym artykule wprowadził również TF-IDF , czyli częstotliwość odwrotną częstotliwości dokumentów terminów, model, w którym punktacja terminu w dokumencie jest stosunkiem liczby terminów w tym dokumencie podzielonej przez częstotliwość występowania liczba dokumentów, w których występuje ten termin. (Pojęcie odwrotnej częstotliwości dokumentów, miary swoistości, zostało wprowadzone w 1972 roku przez Karen Sparck-Jones .) Później zainteresował się automatycznym podsumowaniem i analizą tekstu, a także automatycznym generowaniem hipertekstu. W ciągu swojego życia opublikował ponad 150 artykułów naukowych i 5 książek.

Salton był redaktorem naczelnym Communications of the ACM and the Journal of the ACM oraz przewodniczył grupie Special Interest Group on Information Retrieval (SIGIR). Był zastępcą redaktora działu ACM Transactions on Information Systems . Był stypendystą ACM (wybrany w 1995 r.), Otrzymał nagrodę za zasługi od Amerykańskiego Towarzystwa Nauk Informacyjnych (1989) i był pierwszym laureatem nagrody SIGIR za wybitny wkład w badania nad odzyskiwaniem informacji (1983) - obecnie nazywany Gerard Salton Award .

Bibliografia

  • Salton, Automatyczna organizacja informacji i wyszukiwanie , 1968.
  • Gerard Salton (1975). Teoria indeksowania . Towarzystwo Matematyki Przemysłowej i Stosowanej. p.  56 .
  • --- i Michael J. McGill, Introduction to modern Information Retrieval , 1983. ISBN   0-07-054484-0
  • Gerard Salton (1989). Automatyczne przetwarzanie tekstu . Wydawnictwo Addison-Wesley. p.  530 . ISBN   978-0-201-12227-5 .
  • Gerard Salton na serwerze bibliograficznym DBLPEdytuj to w Wikidata
  • G. Salton, A. Wong i CS Yang (1975), „ A Vector Space Model for Automatic Indexing ”, Communications of the ACM , vol. 18, nr. 11, strony 613–620. (Artykuł, w którym przedstawiono model przestrzeni wektorowej)

Zobacz też

Bibliografia

Linki zewnętrzne

  • Ku pamięci
  • Fractals of Change: Search Down Memory Lane
  • The Most Influential Paper Gerard Salton Never Wrote - This 2004 Library Trends artykuł Davida Dubina służy jako historyczny przegląd metamorfozy terminu model wartości dyskryminacji (TDV) do modelu przestrzeni wektorowej jako modelu wyszukiwania informacji (VSM jako model IR ). Ten artykuł stawia pod znakiem zapytania to, co zdaniem społeczności badawczej Information Retrieval model przestrzeni wektorowej Saltona było pierwotnie przeznaczone do modelowania. To, co znacznie później stało się modelem wyszukiwania informacji, było pierwotnie skoncentrowanym na danych modelem matematyczno-obliczeniowym, używanym jako narzędzie wyjaśniające. Ponadto artykuł Dubina wskazuje, że często cytowany artykuł Salton z 1975 r. Nie istnieje, ale prawdopodobnie jest połączeniem dwóch innych artykułów, z których żaden w rzeczywistości nie odnosi się do VSM jako modelu IR.