SAMPA - SAMPA

Mowa Zaliczenia alfabet fonetyczny ( IPA ) jest czytelny dla komputera skrypt fonetyczny przy użyciu 7-bit druku ASCII znaków, na podstawie międzynarodowej transkrypcji fonetycznej (IPA).

Został pierwotnie opracowany pod koniec lat 80. dla sześciu języków europejskich przez program badań i rozwoju technologii informatycznych EEC ESPRIT . Jak najwięcej symboli zostało przejętych z IPA; tam, gdzie nie jest to możliwe, stosuje się inne znaki, które są dostępne, np. [ @] dla schwa (IPA [ə] ), [ 2] dla samogłoski występującej we francuskim deux (IPA [ø] ) i [ 9] dla samogłoski znalezione we francuskim neuf (IPA [œ] ).

Dziś oficjalnie SAMPA została opracowana dla wszystkich dźwięków następujących języków:

Znaki [ "s{mp@] reprezentują wymowę nazwy SAMPA w języku angielskim, z początkowym symbolem ["] wskazującym na główny akcent. Podobnie jak IPA, SAMPA jest zwykle ujęta w nawiasy kwadratowe lub ukośniki , które nie są częścią właściwego alfabetu i jedynie oznaczają, że jest fonetyczny w przeciwieństwie do zwykłego tekstu.

Cechy

SAMPA została opracowana pod koniec lat 80. w finansowanym przez Komisję Europejską projekcie ESPRIT 2589 „Speech Assessment Methods” (SAM) – stąd „SAM Phonetic Alphabet” – w celu ułatwienia wymiany danych e-mail i przetwarzania obliczeniowego transkrypcji w fonetyce i technologii mowy.

IPA jest częściowym kodowania z alkoholu izopropylowego . Pierwsza wersja SAMPA była połączeniem zestawów kodów fonemów dla języka duńskiego, holenderskiego, angielskiego, francuskiego, niemieckiego i włoskiego; późniejsze wersje rozszerzyły SAMPA na inne języki europejskie. Ponieważ SAMPA opiera się na inwentarzach fonemów, każda tabela SAMPA jest ważna tylko w języku, dla którego została utworzona. W celu uczynienia tego IPA technika kodowania powszechnie stosowane, X-SAMPA został stworzony, który stanowi pojedynczą tabelę bez różnic języka określonych.

SAMPA została opracowana jako hack mający na celu obejście niezdolności kodowania tekstu do reprezentowania symboli IPA. W konsekwencji, wraz z upowszechnianiem się obsługi Unicode dla symboli IPA, zmniejsza się potrzeba oddzielnego, czytelnego dla komputera systemu do przedstawiania IPA w ASCII. Jednak wprowadzanie tekstu opiera się na określonych kodowaniach klawiatury lub urządzeniach wejściowych. Z tego powodu SAMPA i X-SAMPA są nadal szeroko stosowane w fonetyce obliczeniowej i technologii mowy.

Zobacz też

Bibliografia

  • Ranchhod, Elisabeth i J. Mamede, Nuno (2002). Postępy w przetwarzaniu języka naturalnego: Trzecia Międzynarodowa Konferencja, PortTAL 2002, Faro, Portugalia, 23-26 czerwca 2002. Proceedings ( Lecture Notes in Computer Science ) . (wyd. 1). Skoczek. ISBN  3-540-43829-7 .
  • L. DeMiller, Anna i Rettig, James (2000). Językoznawstwo: przewodnik po literaturze referencyjnej (2nd ed.). Biblioteki bez ograniczeń. ISBN  1-56308-619-0 .
  • Lamberts, Koen i Goldstone, Rob (2004). Podręcznik poznania . Sage Publications Ltd. ISBN  0-7619-7277-3 .

Zewnętrzne linki