Hapax legomenon -Hapax legomenon

Wykres rangowy dla słów w powieści Moby-Dick . Około 44% odrębnego zestawu słów w tej powieści, takich jak „małżeński”, występuje tylko raz, podobnie jak hapax legomena (czerwony). Około 17%, takich jak „zręczność”, pojawia się dwukrotnie (tzw. dis legomena , na niebiesko). Prawo Zipfa przewiduje, że słowa na tym wykresie powinny w przybliżeniu odpowiadać linii prostej o nachyleniu -1.

W lingwistyki korpusowej , A hapax legomenon ( / h Ae p ə K s L ɪ ɡ ɒ m ɪ n ɒ ń / również / h Ae p ® k e / lub / H P ć k s / ; pl. hapax legomena ; czasami skracane do hapax , liczba mnoga hapaxes ) to słowolub wyrażenie występujące tylko raz w kontekście: albo w pisemnym zapisie całego języka , w pracach autora, albo w jednym tekście. Termin ten jest czasem błędnie używany do opisania słowa, które występuje tylko w jednej pracy autora, ale więcej niż raz w tej konkretnej pracy. Hapax legomenon jest transliteracji z greckiego ἅπαξ λεγόμενον , czyli „istota powiedział kiedyś”.

Powiązanych terminów DIS legomenon , tris legomenon i tetrakis legomenon r ( / d ɪ s / , / T r ɪ s / , / t ɛ t r ə k ɪ s / ) znajdują się podwójne, potrójne, poczwórne lub zdarzenia , ale są znacznie rzadziej używane.

Hapax legomena są dość powszechne, jak przewiduje prawo Zipfa , które mówi, że częstotliwość każdego słowa w korpusie jest odwrotnie proporcjonalna do jego pozycji w tabeli częstości. W przypadku dużych korpusów około 40% do 60% słów to hapax legomena , a kolejne 10% do 15% to dis legomena . Tak więc w Brown Corpus of American English około połowa z 50 000 odrębnych słów to hapax legomena w tym korpusie.

Hapax legomenon odnosi się do pojawienia się słowa lub wyrażenia w tekście, a nie do jego pochodzenia lub rozpowszechnienia w mowie. W ten sposób różni się od jednorazowego słowa , które może nigdy nie zostać zarejestrowane, może znaleźć walutę i może być powszechnie zapisane, lub może pojawiać się kilka razy w dziele, które je ukuwa , i tak dalej.

Znaczenie

Workman'sPaulineHapaxes.svg
Workman'sShakespearePlays.svg

Hapax legomena w starożytnych tekstach jest zwykle trudny do rozszyfrowania, ponieważ łatwiej jest wywnioskować znaczenie z wielu kontekstów niż z jednego. Na przykład, wiele z pozostałych nierozszyfrowanych glifów Majów to hapax legomena , a biblijne (szczególnie hebrajskie ; patrz § przykłady hebrajskie ) hapax legomena czasami stwarzają problemy w tłumaczeniu. Hapax legomena stawia również wyzwania w przetwarzaniu języka naturalnego .

Niektórzy badacze uważają Hapax legomena za przydatne w określaniu autorstwa dzieł pisanych. PN Harrison w The Problem of the Pastoral Epistles (1921) spopularyzował hapax legomena wśród biblistów , argumentując, że jest ich znacznie więcej w trzech listach pastoralnych niż w innych listach Pawła . Twierdził, że liczba hapax legomena w korpusie domniemanego autora wskazuje na jego słownictwo i jest charakterystyczna dla autora jako jednostki.

Teoria Harrisona straciła na znaczeniu ze względu na szereg problemów podnoszonych przez innych uczonych. Na przykład w 1896 r. WP Workman znalazł następujące liczby hapax legomena w każdym liście Pawła : Rzymian 113, I Kor. 110, II Kor. 99, Gal. 34, Ef. 43 Fil. 41, kol. 38, I Tes. 23, II Tes. 11, Filemona 5, 1 Tym. 82, II Tym. 53, Tytusa 33. Na pierwszy rzut oka trzy ostatnie sumy (listów pasterskich) nie różnią się od pozostałych. Aby uwzględnić różną długość listów, Workman obliczył również średnią liczbę hapax legomena na stronę tekstu greckiego , która wahała się od 3,6 do 13, jak podsumowano na diagramie po prawej stronie. Chociaż Listy pasterskie mają więcej hapax legomena na stronie, Workman stwierdził, że różnice są umiarkowane w porównaniu z różnicami między innymi listami. Zostało to wzmocnione gdy Workman spojrzał na kilka sztuk przez Szekspira , które dały podobne zmiany (od 3,4 do 10,4 na stronie wydania objętościowych Irvinga), jak przedstawiono na drugim wykresie z prawej strony.

Oprócz tożsamości autora istnieje kilka innych czynników, które mogą wyjaśnić liczbę hapax legomena w dziele:

  • długość tekstu: ma to bezpośredni wpływ na oczekiwaną liczbę i procent hapax legomena ; zwięzłość Listów Pasterskich sprawia również, że każda analiza statystyczna staje się problematyczna.
  • temat tekstu: jeśli autor pisze na różne tematy, oczywiście wiele słów tematycznych pojawi się tylko w ograniczonym kontekście.
  • odbiorcy tekstu: jeśli autor pisze do rówieśnika, a nie studenta, lub do współmałżonka, a nie pracodawcy, znowu pojawi się zupełnie inne słownictwo.
  • czas: z biegiem lat zmieni się zarówno język, jak i wiedza autora i użycie języka.

W szczególnym przypadku Listów Pasterskich wszystkie te zmienne różnią się znacznie od tych w pozostałej części korpusu Pawła, a hapax legomena nie są już powszechnie akceptowane jako silne wskaźniki autorstwa (chociaż autorstwo Listów Pasterskich jest przedmiotem dyskusji z innych powodów).

Pojawiają się również subiektywne pytania dotyczące tego, czy dwie formy oznaczają „to samo słowo”: pies vs. psy, wskazówka vs. nieświadomy, znak vs. podpis; pojawia się również wiele innych szarych przypadków. The Jewish Encyclopedia wskazuje, że chociaż w Biblii hebrajskiej jest 1500 haaksów , tylko około 400 nie jest w oczywisty sposób powiązanych z innymi potwierdzonymi formami słów.

Fałszerzowi nie byłoby szczególnie trudno skonstruować dzieło z dowolnym procentem hapax legomena . Wydaje się jednak mało prawdopodobne, aby fałszerze na długo przed XX wiekiem wymyślili taką sztuczkę, a tym bardziej uważali, że jest to warte wysiłku.

Ostatnia trudność związana ze stosowaniem hapax legomena do określania autorstwa polega na tym, że istnieje znaczna zmienność między dziełami, o których wiadomo, że są autorstwa jednego autora, a różni autorzy często wykazują podobne wartości. Innymi słowy, hapax legomena nie są wiarygodnym wskaźnikiem. Obecnie badania autorskie zwykle wykorzystują szeroki zakres miar w poszukiwaniu wzorców, zamiast polegać na pojedynczych pomiarach.

Informatyka

W dziedzinie lingwistyki komputerowej i przetwarzania języka naturalnego (NLP), zwł. lingwistyki korpusowej i NLP uczonego maszynowo , często lekceważy się hapax legomena (i czasami inne rzadkie słowa), ponieważ prawdopodobnie mają one niewielką wartość dla technik obliczeniowych. To lekceważenie ma tę dodatkową zaletę, że znacznie zmniejsza zużycie pamięci przez aplikację, ponieważ zgodnie z prawem Zipfa wiele słów to hapax legomena.

Przykłady

Oto kilka przykładów hapax legomena w językach lub korpusach .

arabskie przykłady

W Koranie :

  • Odpowiednie rzeczowniki Iram (q, 89: 7, Iram Słupy ) Babil (Q 2: 102, Babilon ) Bakka (t) (Q 3:96, Bakkah ) Jibt (P 4:51) ramadan (Q 2: 185, Ramadan ) AR-rum (Q 30: 2, Bizancjum ) Tasnim (P 83:27) Qurayš (P 106: 1, Kurejszyci ) majus (P 22:17, Mędrcy ) Marut ( Q 2:102, Harut i Marut ), Makka(t) (Q 48:24, Mekka ), Nasr (Q 71:23), (Ḏū) an-Nūn (Q 21:87) i Hārūt (Q 2:102 , Harut i Marut ) występują tylko raz.
  • zanjabīl ( زَنْجَبِيلimbir ) to hapax z Koranu (Q 76:17).
  • Epitheton Ornans AS-SAMAD ( الصمد - Jeden modlił ) jest Qur'anic hapax (P 112: 2).
  • ṭūd ( طُوْد - góra ) to hapax z Koranu (Q 26:63).

Chińskie i japońskie znaki

Klasyczna literatura chińska i japońska zawiera wiele chińskich znaków, które występują tylko raz w korpusie, a ich znaczenie i wymowa często zanikają. Znane po japońsku jako kogo (孤語) , dosłownie „samotne postacie”, można je uznać za rodzaj hapax legomenon . Na przykład, Księga Pieśni (ok. 1000 pne) używa znakudokładnie jeden raz w wierszu „伯氏吹埙,仲氏吹篪”, i dopiero po odkryciu opisu przez Guo Pu (276- 324 AD), że postać może być skojarzona z określonym typem starożytnego fletu.

Angielskie przykłady

Słowo „ honorificabilitudinitatibus ”, jak stwierdzono w pierwszej edycji William Shakespeare Play „s Stracone zachody miłości
  • Flother , jako synonim płatka śniegu , to hapax legomenon pisanego angielskiego znalezionego w rękopisie zatytułowanym The XI Pains of Hell (około 1275).
  • Hebenon , trucizną, o których mowa w Shakespeare „s«Hamlet»tylko raz.
  • Honorificabilitudinitatibus to hapax legomenon dzieł Szekspira .
  • Indexy w Bram Stoker „s Dracula , używane jako przymiotnik do opisania stanu sytuacyjnej z żadnym innym dalszego użytkowania w języku„”Jeśli ten człowiek był zwykłym szaleńcem wziąłbym moje szanse ufając mu, ale on wydaje się więc zmieszałem się z hrabią w sposób indeksowany, że boję się zrobić coś złego, pomagając jego modom.
  • Manticcratic , oznaczający „rządy rodziny lub klanu Proroka”, został najwyraźniej wymyślony przez TE Lawrence'a i pojawia się raz w Siedmiu Filarach Mądrości .
  • Nortelrye , słowo oznaczające „edukację”, występuje tylko raz w Chaucer .
  • Zuchwałość , być może w znaczeniu „zuchwałość”, pojawia się tylko raz w opowiadaniu Dickensa „Choinka”.
  • Slæpwerigne , „znużony snem”, występuje dokładnie raz w korpusie staroangielskim , w Księdze Exeter . Trwa debata, czy oznacza to „znużony snem” czy „znużony snem”.
  • Satyr , chociaż powszechnie używane słowo w języku angielskim, jest hapax legomenon dla Szekspira, ponieważ występuje tylko raz w jego pismach.

Niemieckie przykłady

Muspilli linia 57: „dar nimac denne mak andremo helfan uora demo muspille” ( Bawarska Biblioteka Państwowa Clm 14098, f. 121r)

Starożytne greckie przykłady

  • Według klasycznego uczonego Clyde'a PharraIliada ma 1097 hapax legomena , podczas gdy Odyseja ma 868”. Inni jednak inaczej zdefiniowali ten termin i liczą tylko 303 w Iliadzie i 191 w Odysei .
  • panaōrios ( παναώριος ), starożytna greka oznaczająca „bardzo nie w porę”, to jedno z wielu słów, które występują w Iliadzie tylko raz .
  • Grecki Nowy Testament zawiera 686 lokalnych hapax legomena , które są czasami nazywane „hapaksami Nowego Testamentu”. 62 z nich występuje w 1 Piotra, a 54 w 2 Piotra .
  • Epiousios , przetłumaczony na angielski jako „codzienny” w Modlitwie Pańskiej w Mateusza 6:11 i Łukasza 11:3 , nie pojawia się nigdzie indziej w całej znanej literaturze starożytnej Grecji.
  • Słowo aphedrōn (ἀφεδρών) „latryna” w greckim Nowym Testamencie występuje tylko dwa razy, w Mateusza 15:17 i Marka 7:19, ale ponieważ powszechnie uważa się, że pisarz Ewangelii Mateusza użył Ewangelii Marka jako źródła, może być uważany za hapax legomenon . Błędnie przetłumaczono ją jako „jelita”, dopóki inskrypcja z Lex de astynomis Pergamenorum („Prawo urzędników miejskich Pergamonu ”) nie potwierdziła, że ​​oznacza to „latrynę”.

Hebrajskie przykłady

Liczba odrębnych hapax legomena w Biblii hebrajskiej wynosi 1480 (z łącznej liczby 8679 różnych użytych słów). Jednak ze względu na hebrajskie korzenie , przyrostki i przedrostki , tylko 400 to „prawdziwe” hapax legomena. Pełną listę można zobaczyć we wpisie Jewish Encyclopedia dla „Hapax Legomena”.

Oto kilka przykładów:

  • Akut (אקוט – walczył), pojawia się tylko raz w Biblii hebrajskiej, w Psalmie 95:10.
  • Atzei Suseł (עֲצֵי-גֹפֶר – drewno susła ) jest raz wspomniane w Biblii, w Księdze Rodzaju 6:14, w instrukcji wykonania arki Noego „z drewna susła”. Ze względu na jego pojedynczy wygląd, jego dosłowne znaczenie zostaje utracone. Suseł to po prostu transliteracja , chociaż uczeni wstępnie sugerują, że zamierzonym drewnem jest cyprys .
  • Gvina (גבינה – ser ) to hapax legomenon z biblijnego hebrajskiego , występujący tylko w Joba 10:10. Słowo to stało się niezwykle powszechne we współczesnym języku hebrajskim .
  • Zechuchith (זכוכית) jest hapax legomenon z biblijnego hebrajskiego , znalezionym tylko w Job 28:17. Słowo to wywodzi się od rdzenia זכה z-ch-h , co oznacza przezroczysty/przezroczysty i odnosi się do szkła lub kryształu . We współczesnym hebrajskim jest używany jako „szkło”.
  • Lilith (לילית) występuje raz w Biblii hebrajskiej , w Księdze Izajasza 34:14, która opisuje spustoszenie Edomu . Jest tłumaczony na kilka sposobów.

Przykład irlandzki

włoskie przykłady

  • Ramogna pojawia się jedynie, gdy w literaturze włoskiej , zwłaszcza w Dante jest Divina Commedia ( Czyściec XI, 25).
  • Czasownik attuia pojawia się raz w comedii ( Purgatorio XXXIII, 48). Znaczenie jest kwestionowane, ale zwykle interpretowane jako „zaciemnia” lub „utrudnia”. Niektóre rękopisy podają zamiast tego alternatywę hapax accuia .
  • Trasumanar to kolejny hapax legomenon wspomniany w Komedii ( Paradiso I, 70, przetłumaczony jako „Przejście poza człowieka” przez Mandelbauma ).
  • Ultrafilosofia , co oznacza "poza filozofią" pojawia się w Leopardi „s Zibaldone (Zibaldone 114-115 - czerwiec, 7. 1820).

Przykłady łacińskie

  • Deproeliantis , imiesłów słowa deproelior , co oznacza „walczyć zaciekle” lub „walczyć gwałtownie”, pojawia się tylko w wersie 11 Ody 1.9 Horacego .
  • Mactatu , liczba pojedyncza od słowa mactatus , co oznacza "z powodu zabijania". Występuje tylko w De rerum natura przez Lukrecjusza .
  • Mnemosynus przypuszczalnie oznaczające pamiątkę lub memorandum pojawia się tylko w Wiersz 12 Catullus jest Carmina .
  • Scortillum , drobna postać znaczenie „mała prostytutka” występuje tylko w Wiersz 10 z Catullus jest Carmina , wiersz 3.
  • Terricrepo , przymiotnik najwyraźniej nawiązując do gromkimi metodą oratoryjnej, występuje tylko w Księdze 8 Augustine „s Wyznań .
  • Romanitas , rzeczownik oznaczający „Romanizm”, „Rzymski sposób” lub „Rzymski sposób”, pojawia się tylko u Tertuliana de Pallio .
  • Arepo to nazwa własna, którą można znaleźć tylko na placu Sator . Wywodzi się z pisowni opera od tyłu.
  • Eoigena , przymiotnik odnoszący się do słońca i oznaczający „urodzony na wschodzie”, pojawia się tylko w epigrafie znalezionym w Castellammare di Stabia (starożytne Stabiae ).

przykłady słowiańskie

  • Vytol (вытол) to hapax legomenon ze znanego korpusu średniowiecznych rosyjskich rękopisów z kory brzozowej . Słowo to występuje w inskrypcji nr. 600 z Nowogrodu , dat. 1220-1240, w kontekście „[the] vytol został złapany” (вытоло изловили). Według Andreya Zaliznyaka słowo to nie występuje nigdzie indziej, a jego znaczenie nie jest znane. Zaproponowano różne interpretacje, takie jak imię i nazwisko czy status społeczny osoby.

W kulturze popularnej

  • Awangardowy filmowiec Hollis Frampton nakręcił w latach 1971-1972 serię siedmiu filmów zatytułowanych Hapax Legomena I: Nostalgia to Hapax Legomena VII: Special Effects .
  • „Hapax legomenon” jako określenie krótko widocznym w Wielkiej Brytanii po stał 2014-15 University Challange Finału, po filmy poszedł wirusowy z Gonville i Caius uczeń Ted Loveday szybko podając ją jako prawidłową odpowiedź, kiedy prezenter Jeremy Paxman zdołał tylko zapytać „Znaczenie 'powiedział tylko raz', jakie dwuwyrazowe greckie słowo oznacza słowo...".
  • Słowo „ zagadkowo” zostało przytoczone przez gospodarza Vsauce, Michaela Stevensa w 2015 r., jako przykład legomenonu hapax, przy czym Google zwracało tylko jeden wynik wyszukiwania tego słowa w tym czasie. Od tego czasu termin na krótko stał się memem internetowym , a teraz zwraca ponad 20 000 wyników wyszukiwania Google.
  • W grze wideo NetHack „HAPAX LEGOMENON” jest jednym z możliwych losowych tekstów wciąż niezidentyfikowanego rodzaju magicznego zwoju. Po przeczytaniu zwój rzuca swój magiczny efekt, a następnie znika („rzecz powiedziana raz”), ale prawdopodobnie zostanie odtąd zidentyfikowany (np. zwój zaklętej zbroi, zwój teleportacji itp.) dla tej rozgrywki.
  • „Hapax Legomenon” to imię czarodzieja przyjaciela Heden z powieści „Złodziej” Matta Colville'a, drugiej książki z jego serii Ratcatchers.

Zobacz też

Bibliografia

Zewnętrzne linki