Interoperacyjność semantyczna - Semantic interoperability

Interoperacyjność semantyczna to zdolność systemów komputerowych do wymiany danych o jednoznacznym, wspólnym znaczeniu. Interoperacyjność semantyczna jest wymogiem umożliwiającym logikę obliczeniową komputera , wnioskowanie, odkrywanie wiedzy i federację danych między systemami informacyjnymi .

Interoperacyjność semantyczna dotyczy zatem nie tylko pakowania danych ( składnia ), ale jednoczesnego przekazywania znaczenia z danymi ( semantyka ). Osiąga się to poprzez dodanie danych o danych ( metadane ), łącząc każdy element danych z kontrolowanym, współdzielonym słownikiem . Znaczenie danych jest przekazywane wraz z samymi danymi w jednym samoopisującym się „ pakietu informacyjnym ”, który jest niezależny od jakiegokolwiek systemu informacyjnego. To właśnie to wspólne słownictwo i związane z nim powiązania z ontologią stanowią podstawę i możliwości interpretacji maszynowej, wnioskowania i logiki.

Interoperacyjność syntaktyczna (patrz poniżej ) jest warunkiem wstępnym interoperacyjności semantycznej. Interoperacyjność syntaktyczna odnosi się do mechanizmów pakowania i transmisji danych. W opiece zdrowotnej HL7 jest używany od ponad trzydziestu lat (co poprzedza Internet i technologie sieciowe) i używa znaku kreski pionowej (|) jako ogranicznika danych. Obecnym standardem internetowym dla znaczników dokumentów jest XML , który używa znaku „< >” jako ogranicznika danych. Ograniczniki danych nie mają żadnego znaczenia dla danych poza strukturą danych. Bez słownika danych do tłumaczenia zawartości ograniczników dane pozostają bez znaczenia. Chociaż istnieje wiele prób tworzenia słowników danych i modeli informacji, które można powiązać z tymi mechanizmami pakowania danych, żadna z nich nie była praktyczna do wdrożenia. To tylko utrwaliło trwającą „babelizację” danych i niemożność wymiany danych ze znaczeniem.

Od czasu wprowadzenia koncepcji sieci semantycznej przez Tima Bernersa-Lee w 1999 roku, wzrosło zainteresowanie i stosowanie standardów W3C (World Wide Web Consortium) w celu zapewnienia semantycznej wymiany danych, federacji i możliwości wnioskowania w skali internetowej.

Semantyka jako funkcja interoperacyjności składniowej

Interoperacyjność syntaktyczna, którą zapewniają na przykład standardy XML lub SQL , jest warunkiem wstępnym semantyki. Obejmuje wspólny format danych i wspólny protokół do strukturyzowania dowolnych danych, tak aby sposób przetwarzania informacji można było zinterpretować na podstawie struktury. Umożliwia również wykrywanie błędów składniowych, dzięki czemu systemy odbierające mogą zażądać ponownego wysłania każdej wiadomości, która wydaje się być nieczytelna lub niekompletna. Nie jest możliwa komunikacja semantyczna, jeśli składnia jest zniekształcona lub nie może reprezentować danych. Jednak informacje reprezentowane w jednej składni mogą w niektórych przypadkach zostać dokładnie przetłumaczone na inną składnię. Tam, gdzie możliwe jest dokładne tłumaczenie składni, systemy używające różnych składni mogą również dokładnie współpracować. W niektórych przypadkach możliwość dokładnego tłumaczenia informacji między systemami przy użyciu różnych składni może być ograniczona do jednego kierunku, gdy użyte formalizmy mają różne poziomy wyrazistości (zdolność do wyrażania informacji).

Pojedyncza ontologia zawierająca reprezentacje każdego terminu użytego w każdym zastosowaniu jest ogólnie uważana za niemożliwą z powodu szybkiego tworzenia nowych terminów lub przypisywania nowych znaczeń do starych terminów. Jednakże, chociaż niemożliwe jest przewidzenie każdego pojęcia, które użytkownik może chcieć reprezentować na komputerze, istnieje możliwość znalezienia pewnego skończonego zestawu „prymitywnych” reprezentacji pojęć, które można połączyć w celu stworzenia dowolnego z bardziej szczegółowych pojęć, które użytkownicy może wymagać dowolnego zestawu aplikacji lub ontologii. Posiadanie podstawowej ontologii (zwanej również wyższą ontologią ), która zawiera wszystkie te elementy pierwotne, zapewniłoby solidną podstawę dla ogólnej interoperacyjności semantycznej i umożliwiłoby użytkownikom definiowanie wszelkich nowych terminów, których potrzebują, przy użyciu podstawowego spisu elementów ontologicznych i nadal posiadanie tych nowych. zdefiniowane terminy właściwie zinterpretowane przez każdy inny system komputerowy, który może interpretować podstawową ontologię podstawową. To, czy liczba takich prymitywnych reprezentacji pojęć jest rzeczywiście skończona, czy też będzie się rozszerzać w nieskończoność, jest kwestią w trakcie aktywnego badania. Jeśli jest skończony, to stabilna ontologia podstawowa odpowiednia do wspierania dokładnej i ogólnej interoperacyjności semantycznej może ewoluować po przetestowaniu pewnej początkowej ontologii podstawowej i użyciu jej przez wielu różnych użytkowników. W chwili obecnej żadna ontologia fundamentowa nie została przyjęta przez szeroką społeczność, więc taka stabilna ontologia fundamentowa jest wciąż w przyszłości.

Słowa i znaczenia

Jednym z uporczywych nieporozumień powracających w dyskusji o semantyce jest „pomieszanie słów i znaczeń”. Znaczenie słów zmienia się czasami bardzo szybko. Ale język formalny, taki jak używany w ontologii, może kodować znaczenia (semantykę) pojęć w formie, która się nie zmienia. Aby określić, jakie jest znaczenie danego słowa (lub terminu w bazie danych , na przykład) konieczne jest oznaczenie każdej ustalonej reprezentacji pojęcia w ontologii słowem(ami) lub terminem(ami), które mogą się do niego odnosić pojęcie. Kiedy wiele słów odnosi się do tego samego (stałego) pojęcia w języku, nazywa się to synonimią ; kiedy jedno słowo jest używane w odniesieniu do więcej niż jednego pojęcia, nazywa się to niejednoznacznością .

Niejednoznaczność i synonimia są jednymi z czynników, które bardzo utrudniają komputerowe zrozumienie języka. Użycie słów w odniesieniu do pojęć (znaczeń użytych słów) jest bardzo wrażliwe na kontekst i cel każdego użycia wielu terminów czytelnych dla człowieka. Wykorzystanie ontologii we wspieraniu interoperacyjności semantycznej ma zapewnić stały zestaw pojęć, których znaczenia i relacje są stabilne i mogą być uzgodnione przez użytkowników. Zadanie określenia, które terminy w jakich kontekstach (każda baza danych jest innym kontekstem) jest następnie oddzielone od zadania tworzenia ontologii i musi zostać podjęte przez projektanta bazy danych lub projektanta formularza do wprowadzania danych , lub twórcą programu do rozumienia języka. Kiedy zmienia się znaczenie słowa użytego w jakimś interoperacyjnym kontekście, to w celu zachowania interoperacyjności konieczna jest zmiana wskaźnika na element(-y) ontologii, który określa znaczenie tego słowa.

Wymagania i języki dotyczące reprezentacji wiedzy

Język reprezentacji wiedzy może być wystarczająco ekspresyjny, aby opisać niuanse znaczeniowe w dobrze zrozumianych dziedzinach. Jest ich co najmniej pięć poziomów złożoności.

W przypadku ogólnych danych częściowo ustrukturyzowanych można użyć języka ogólnego przeznaczenia, takiego jak XML.

Do wielu zadań mogą być wymagane języki z pełną mocą logiki predykatów pierwszego rzędu .

Języki ludzkie są bardzo ekspresyjne, ale są uważane za zbyt niejednoznaczne, aby umożliwić pożądaną dokładną interpretację, biorąc pod uwagę obecny poziom technologii języka ludzkiego.

Wcześniejsza zgoda nie jest wymagana

Interoperacyjność semantyczną można odróżnić od innych form interoperacyjności poprzez rozważenie, czy przekazywane informacje mają w swojej przekazanej formie całe znaczenie wymagane, aby system odbiorczy mógł je poprawnie zinterpretować, nawet jeśli algorytmy używane przez system odbiorczy są nieznane wysyłanie systemu. Rozważ wysłanie jednego numeru:

Jeśli ta liczba ma być sumą pieniędzy, którą jedna firma jest winna drugiej, oznacza to działanie lub brak działania ze strony zarówno tych, którzy ją wysyłają, jak i tych, którzy ją otrzymują.

Może być poprawnie zinterpretowany, jeśli zostanie wysłany w odpowiedzi na konkretne żądanie i otrzymany w oczekiwanym czasie i formie. Ta prawidłowa interpretacja nie zależy tylko od samej liczby, która mogłaby reprezentować prawie każdy z milionów rodzajów pomiarów ilościowych, ale zależy ona ściśle od okoliczności transmisji. Oznacza to, że interpretacja zależy od tego, czy oba systemy oczekują, że algorytmy w drugim systemie użyją liczby w dokładnie tym samym sensie, a ponadto zależy od całej obwiedni transmisji poprzedzających rzeczywistą transmisję samej liczby.

Natomiast jeśli system nadawczy nie wie, w jaki sposób informacja zostanie wykorzystana przez inne systemy, konieczne jest wspólne porozumienie co do tego, w jaki sposób informacja o określonym znaczeniu (spośród wielu możliwych) pojawi się w komunikacie. W przypadku konkretnego zadania jednym z rozwiązań jest ujednolicenie formularza, np. wezwania do zapłaty; żądanie to musiałoby zakodować, w znormalizowany sposób, wszystkie informacje potrzebne do jego oceny, takie jak: agent jest winien pieniądze, agent był winien pieniądze, charakter działania powodującego powstanie długu, agenci, towary , usług i innych uczestników tego działania; czas akcji; należna kwota i waluta, w której dług jest naliczany; termin płatności; żądana forma płatności; i inne informacje. Gdy dwa lub więcej systemów uzgodniło, jak interpretować informacje zawarte w takim żądaniu, mogą osiągnąć interoperacyjność semantyczną dla tego konkretnego typu transakcji . Ogólnie rzecz biorąc, dla interoperacyjności semantycznej konieczne jest zapewnienie ustandaryzowanych sposobów opisywania znaczeń wielu innych rzeczy niż tylko transakcje handlowe, a liczba pojęć, których reprezentację należy uzgodnić, wynosi co najmniej kilka tysięcy.

Badania ontologiczne

Jak osiągnąć interoperacyjność semantyczną dla więcej niż kilku ograniczonych scenariuszy jest obecnie przedmiotem badań i dyskusji. W przypadku problemu ogólnej interoperacyjności semantycznej wymagana jest jakaś forma podstawowej ontologii („ ontologia górna ”), która jest wystarczająco obszerna, aby zapewnić definicję pojęć dla bardziej wyspecjalizowanych ontologii w wielu dziedzinach. W ciągu ostatniej dekady opracowano ponad dziesięć podstawowych ontologii, ale żadna nie została jeszcze przyjęta przez szeroką bazę użytkowników.

Potrzeby pojedynczej, kompleksowej, obejmującej wszystkie elementy ontologii wspierającej interoperacyjność semantyczną można uniknąć, projektując wspólną podstawową ontologię jako zbiór podstawowych („prymitywnych”) pojęć, które można łączyć w celu stworzenia logicznych opisów znaczeń terminów używanych w lokalne ontologie domeny lub lokalne bazy danych. Ta taktyka opiera się na zasadzie, że:

Gdyby:

(1) uzgodniono znaczenia i użycie elementów ontologii pierwotnej w ontologii podstawowej, oraz 
(2) elementy ontologii w ontologiach dziedzinowych są konstruowane jako logiczne kombinacje elementów ontologii podstawowej,

Następnie:

Zamierzone znaczenia elementów ontologii dziedziny mogą być obliczone automatycznie za pomocą wnioskowania FOL (logika pierwszego rzędu), przez dowolny system, który akceptuje znaczenia elementów w ontologii podstawowej i ma zarówno ontologię podstawową, jak i specyfikacje logiczne elementy ontologii dziedzinowej.

W związku z tym:

Każdy system, który chce dokładnie współdziałać z innym systemem, musi przesyłać tylko dane, które mają być przekazane, oraz wszelkie logiczne opisy terminów użytych w tych danych, które zostały utworzone lokalnie i nie znajdują się jeszcze we wspólnej ontologii podstawowej.

Ta taktyka następnie ogranicza potrzebę uprzedniego uzgodnienia znaczeń tylko do tych elementów ontologii we wspólnej Ontologii Podstawowej (FO). Z kilku względów może to wymagać mniej niż 10 000 elementów (typów i relacji). Jednakże, dla ułatwienia zrozumienia i użycia, więcej elementów ontologii z dodatkowymi szczegółami i szczegółami może pomóc w znalezieniu dokładnej lokalizacji w FO, gdzie można znaleźć lub dodać określone koncepcje domeny.

W praktyce, wraz z FO skupiającym się na reprezentacjach pierwotnych pojęć, prawdopodobnie będzie również używany zestaw ontologii rozszerzenia domeny do FO z elementami określonymi za pomocą elementów FO. Takie istniejące wcześniej rozszerzenia zmniejszą koszty tworzenia ontologii domen poprzez nadanie istniejącym elementom zamierzonego znaczenia i zmniejszą ryzyko błędu dzięki wykorzystaniu elementów, które zostały już przetestowane. Ontologie rozszerzeń domen mogą być ze sobą logicznie niespójne i należy to określić, jeśli w jakiejkolwiek komunikacji używane są różne rozszerzenia domen.

Badane jest również to, czy zastosowanie takiej pojedynczej podstawowej ontologii można uniknąć dzięki wyrafinowanym technikom mapowania wśród niezależnie opracowanych ontologii.

Znaczenie

Praktyczne znaczenie interoperacyjności semantycznej zostało zmierzone w kilku badaniach, w których oszacowano koszt (w postaci utraconej wydajności) spowodowany brakiem interoperacyjności semantycznej. W jednym z badań, koncentrujących się na utraconej wydajności w przekazywaniu informacji dotyczących opieki zdrowotnej, oszacowano, że dzięki wdrożeniu skutecznego standardu interoperacyjności w tym obszarze można by zaoszczędzić 77,8 mld USD rocznie. Inne badania, dotyczące branży budowlanej i łańcucha dostaw produkcji samochodów, szacują koszty na ponad 10 miliardów USD rocznie z powodu braku interoperacyjności semantycznej w tych branżach. W sumie te liczby można ekstrapolować, aby wskazać, że z powodu braku szeroko stosowanego standardu interoperacyjności semantycznej w samych Stanach Zjednoczonych traci się znacznie ponad 100 miliardów dolarów rocznie.

Nie przeprowadzono jeszcze badania dotyczącego każdej dziedziny polityki, która przy zastosowaniu standardów interoperacyjności semantycznej mogłaby przynieść duże oszczędności kosztów. Aby jednak zobaczyć, które dziedziny polityki mogą odnieść korzyści z interoperacyjności semantycznej, patrz ogólnie „ Interoperacyjność ”. Takimi obszarami polityki są administracja elektroniczna , zdrowie, bezpieczeństwo i wiele innych. W czerwcu 2007 r. UE utworzyła również Europejskie Centrum Interoperacyjności Semantycznej .

Interoperacyjność semantyczna dla Internetu rzeczy

Transformacja cyfrowa niesie ze sobą ogromne korzyści, ponieważ umożliwia organizacjom bycie bardziej wydajnym, bardziej elastycznym i sprawniejszym w reagowaniu na zmiany w warunkach biznesowych i operacyjnych. Wiąże się to z koniecznością integracji heterogenicznych danych i usług w całej organizacji. Interoperacyjność semantyczna odpowiada na potrzebę wspólnego zrozumienia znaczenia i kontekstu.

Aby to wesprzeć, międzyorganizacyjna grupa ekspercka obejmująca ISO/IEC JTC1, ETSI, oneM2M i W3C współpracuje z AIOTI nad przyspieszeniem wdrażania technologii semantycznych w IoT. Grupa niedawno opublikowała dwa wspólne dokumenty dotyczące interoperacyjności semantycznej, odpowiednio zatytułowane „Semantic IoT Solutions – A Developer Perspective” oraz „Towards semantic interoperability standardy based ontologies”. Wynika to z sukcesu wcześniejszej białej księgi „Semantic Interoperability for the Web of Things”.


Źródło:

„Semantyczne rozwiązania IoT – perspektywa programisty”

„W kierunku standardów interoperacyjności semantycznej opartych na ontologiach”.

Wynika to z sukcesu wcześniejszej białej księgi „Semantyczna interoperacyjność w sieci rzeczy”.

https://www.w3.org/blog/2019/10/aioti-iso-iec-jtc1-etsi-onem2m-and-w3c-collaborate-on-two-joint-white-papers-on-semantic-interoperability- targetowania-deweloperów-i-inżynierów-normalizacji/

Zobacz też

Bibliografia

Zewnętrzne linki