SAMPA - SAMPA
Mowa Zaliczenia alfabet fonetyczny ( IPA ) jest czytelny dla komputera skrypt fonetyczny przy użyciu 7-bit druku ASCII znaków, na podstawie międzynarodowej transkrypcji fonetycznej (IPA).
Został pierwotnie opracowany pod koniec lat 80. dla sześciu języków europejskich przez program badań i rozwoju technologii informatycznych EEC ESPRIT . Jak najwięcej symboli zostało przejętych z IPA; tam, gdzie nie jest to możliwe, stosuje się inne znaki, które są dostępne, np. [ @
] dla schwa (IPA [ə] ), [ 2
] dla samogłoski występującej we francuskim deux (IPA [ø] ) i [ 9
] dla samogłoski znalezione we francuskim neuf (IPA [œ] ).
Dziś oficjalnie SAMPA została opracowana dla wszystkich dźwięków następujących języków:
Znaki [ "s{mp@
] reprezentują wymowę nazwy SAMPA w języku angielskim, z początkowym symbolem ["] wskazującym na główny akcent. Podobnie jak IPA, SAMPA jest zwykle ujęta w nawiasy kwadratowe lub ukośniki , które nie są częścią właściwego alfabetu i jedynie oznaczają, że jest fonetyczny w przeciwieństwie do zwykłego tekstu.
Cechy
SAMPA została opracowana pod koniec lat 80. w finansowanym przez Komisję Europejską projekcie ESPRIT 2589 „Speech Assessment Methods” (SAM) – stąd „SAM Phonetic Alphabet” – w celu ułatwienia wymiany danych e-mail i przetwarzania obliczeniowego transkrypcji w fonetyce i technologii mowy.
IPA jest częściowym kodowania z alkoholu izopropylowego . Pierwsza wersja SAMPA była połączeniem zestawów kodów fonemów dla języka duńskiego, holenderskiego, angielskiego, francuskiego, niemieckiego i włoskiego; późniejsze wersje rozszerzyły SAMPA na inne języki europejskie. Ponieważ SAMPA opiera się na inwentarzach fonemów, każda tabela SAMPA jest ważna tylko w języku, dla którego została utworzona. W celu uczynienia tego IPA technika kodowania powszechnie stosowane, X-SAMPA został stworzony, który stanowi pojedynczą tabelę bez różnic języka określonych.
SAMPA została opracowana jako hack mający na celu obejście niezdolności kodowania tekstu do reprezentowania symboli IPA. W konsekwencji, wraz z upowszechnianiem się obsługi Unicode dla symboli IPA, zmniejsza się potrzeba oddzielnego, czytelnego dla komputera systemu do przedstawiania IPA w ASCII. Jednak wprowadzanie tekstu opiera się na określonych kodowaniach klawiatury lub urządzeniach wejściowych. Z tego powodu SAMPA i X-SAMPA są nadal szeroko stosowane w fonetyce obliczeniowej i technologii mowy.
Zobacz też
- Porównanie kodowań ASCII międzynarodowego alfabetu fonetycznego
- Wykres SAMPA
- Wykres SAMPA dla języka angielskiego , wersja zwięzła
- X-SAMPA , niezależna od języka notacja podobna do SAMPA, ale obejmująca cały repertuar IPA
- Korpus Mowy BABEL
Bibliografia
- Ranchhod, Elisabeth i J. Mamede, Nuno (2002). Postępy w przetwarzaniu języka naturalnego: Trzecia Międzynarodowa Konferencja, PortTAL 2002, Faro, Portugalia, 23-26 czerwca 2002. Proceedings ( Lecture Notes in Computer Science ) . (wyd. 1). Skoczek. ISBN 3-540-43829-7 .
- L. DeMiller, Anna i Rettig, James (2000). Językoznawstwo: przewodnik po literaturze referencyjnej (2nd ed.). Biblioteki bez ograniczeń. ISBN 1-56308-619-0 .
- Lamberts, Koen i Goldstone, Rob (2004). Podręcznik poznania . Sage Publications Ltd. ISBN 0-7619-7277-3 .
Zewnętrzne linki
- SAMPA odczytywalny komputerowo alfabet fonetyczny
- Notacja fonemiczna języka angielskiego w SAMPA
- SAMPA dla Szkotów
- Konwerter tekstu pisanego (niemiecki) na SAMPA i IPA (aplikacja Ajax)
- IPA-SAMPA Converter i wykres IPA-SAMPA