Prosty system organizacji wiedzy - Simple Knowledge Organization System

SKOS
Prosty system organizacji wiedzy
Status Opublikowano ( zalecenie W3C )
Rok się rozpoczął 1997 ; 24 lata temu  ( 1997 )
Ostatnia wersja Core , Reference , RDF , Primer
sierpień 2009, 18 ; 11 lat temu  ( 18-08-2009 )
Organizacja Konsorcjum World Wide Web (W3C)
Komisja Grupa robocza ds. Wdrażania sieci semantycznej
Autorski Alistair Miles , Sean Bechhofer
Podstawowe standardy RDF
Powiązane normy RDFa , OWL , ISO 25964 , Dublin Core
Domena Sieć semantyczna
Skrót SKOS
Stronie internetowej www .w3 .org / 2009 /08 / SKOS-reference / SKOS .html

Prosty system organizacji wiedzy ( SKOS ) to zalecenie W3C przeznaczone do reprezentacji tezaurusów , schematów klasyfikacyjnych , taksonomii , systemów tematycznych lub dowolnego innego rodzaju ustrukturyzowanego kontrolowanego słownictwa . SKOS jest częścią rodziny standardów sieci semantycznej zbudowanej na RDF i RDFS , a jej głównym celem jest umożliwienie łatwej publikacji i korzystania z takich słowników, jak dane połączone .

Historia

Projekt DESIRE II (1997–2000)

Najbardziej bezpośrednim przodkiem SKOS był tezaurus RDF podjęty w drugiej fazie projektu UE DESIRE. Zmotywowani potrzebą ulepszenia interfejsu użytkownika i użyteczności przeglądania i wyszukiwania wielu usług, stworzono podstawowe słownictwo RDF dla tezaurusa. Jak zauważono później w planie pracy SWAD-Europe, praca DESIRE została przyjęta i dalej rozwijana w projektach SOSIG i LIMBER. Wersja implementacji DESIRE / SOSIG została opisana na warsztatach W3C QL'98, motywując wczesną pracę nad regułami RDF i językami zapytań: A Query and Inference Service for RDF.

LIMBER (1999–2001)

SKOS opierał się na wynikach projektu Language Independent Metadata Browsing of European Resources (LIMBER), finansowanego przez Wspólnotę Europejską i będącego częścią programu Technologie społeczeństwa informacyjnego . W ramach projektu LIMBER CCLRC dalej opracował format wymiany tezaurusa RDF , który został zademonstrowany w European Language Social Science Thesaurus (ELSST) w brytyjskim Data Archive jako wielojęzyczna wersja angielskiego tezaurusa humanistyki i nauk społecznych (HASSET), który został zaplanowany do wykorzystania przez Radę Europejskich Archiwów Danych Nauk Społecznych CESSDA.

SWAD-Europe (2002–2004)

SKOS jako odrębna inicjatywa rozpoczęła się w projekcie SWAD-Europe, gromadząc partnerów zarówno z DESIRE, SOSIG (ILRT), jak i LIMBER (CCLRC), którzy pracowali z wcześniejszymi wersjami schematu. Został on opracowany w pakiecie roboczym Thesaurus Activity, w projekcie Semantic Web Advanced Development for Europe (SWAD-Europe). SWAD-Europe został sfinansowany przez Wspólnotę Europejską i stanowi część programu Technologie społeczeństwa informacyjnego . Projekt miał na celu wsparcie Semantic Web Activity W3C poprzez badania, demonstracje i działania informacyjne prowadzone przez pięciu partnerów projektu: ERCIM , ILRT z Bristol University , HP Labs , CCLRC i Stilo. Pierwsze wydanie SKOS Core i SKOS Mapping zostało opublikowane pod koniec 2003 roku, wraz z innymi produktami dotyczącymi kodowania RDF wielojęzycznych tezaurusów i mapowania tezaurusa.

Działalność w zakresie sieci semantycznej (2004–2005)

Po rozwiązaniu SWAD-Europe, wysiłki SKOS były wspierane przez W3C Semantic Web Activity w ramach grupy roboczej Best Practice and Deployment. W tym okresie skupiono się zarówno na konsolidacji SKOS Core, jak i na opracowaniu praktycznych wskazówek dotyczących przenoszenia i publikowania tezaurusów dla sieci semantycznej.

Rozwój jako zalecenie W3C (2006–2009)

Główne opublikowane dokumenty SKOS - Podstawowy przewodnik po SKOS, Podstawowa specyfikacja słownictwa SKOS oraz Krótki przewodnik po publikacji tezaurusa w sieci semantycznej - zostały opracowane w ramach procesu roboczego W3C. Głównymi redaktorami SKOS byli Alistair Miles, początkowo Dan Brickley i Sean Bechhofer.

Grupa Robocza ds. Wdrażania Sieci Semantycznej, powołana na dwa lata (maj 2006 - kwiecień 2008), przedstawiła w swoim statucie, aby popchnąć SKOS do przodu na ścieżce rekomendacji W3C . Mapa drogowa przewidywała SKOS jako rekomendację kandydata do końca 2007 r. Oraz jako Proponowaną rekomendację na pierwszy kwartał 2008 r. Głównymi problemami do rozwiązania było określenie dokładnego zakresu stosowania i powiązanie go z innymi językami RDF i standardami używanymi w biblioteki (takie jak Dublin Core ).

Formalne wydanie (2009)

18 sierpnia 2009 r. W3C wydało nowy standard, który tworzy pomost między światem systemów organizacji wiedzy - w tym tezaurusami, klasyfikacjami, nagłówkami przedmiotów, taksonomiami i kategoriami ludowymi - a połączoną społecznością danych , przynosząc korzyści obu. Biblioteki, muzea, gazety, portale rządowe, przedsiębiorstwa, aplikacje sieci społecznościowych i inne społeczności, które zarządzają dużymi zbiorami książek, artefaktów historycznych, wiadomości, glosariuszy biznesowych, wpisów na blogach i innych elementów, mogą teraz używać SKOS do wykorzystania możliwości powiązanych dane.

Historyczny widok komponentów

SKOS został pierwotnie zaprojektowany jako modułowa i rozszerzalna rodzina języków, zorganizowana jako SKOS Core, SKOS Mapping i SKOS Extensions oraz jako Metamodel. Cała specyfikacja jest teraz kompletna w przestrzeni nazw http://www.w3.org/2004/02/skos/core# .

Przegląd

Oprócz samego odniesienia, SKOS Primer (notatka grupy roboczej W3C) podsumowuje prosty system organizacji wiedzy.

SKOS definiuje klasy i właściwości wystarczające do przedstawienia wspólnych cech znajdujących się w standardowym tezaurusie. Opiera się na pojęciowym spojrzeniu na słownictwo, gdzie prymitywne przedmioty nie są terminami, ale abstrakcyjnymi pojęciami reprezentowanymi przez terminy. Każda koncepcja SKOS jest definiowana jako zasób RDF . Każda koncepcja może mieć dołączone właściwości RDF, w tym:

  • jedno lub więcej preferowanych terminów indeksowych (maksymalnie po jednym w każdym języku naturalnym)
  • alternatywne terminy lub synonimy
  • definicje i uwagi, z podaniem ich języka

Pojęcia mogą być organizowane w hierarchie przy użyciu szerszych i węższych relacji lub połączone relacjami niehierarchicznymi (asocjacyjnymi). Pojęcia można gromadzić w schematach pojęć, aby zapewnić spójne i uporządkowane zbiory pojęć, reprezentujące całość lub część kontrolowanego słownictwa.

Kategorie elementów

Głównymi kategoriami elementów SKOS są pojęcia, etykiety, zapisy, dokumentacja, relacje semantyczne, właściwości odwzorowania i zbiory. Powiązane elementy wymieniono w poniższej tabeli.

Słownictwo SKOS zorganizowane tematycznie
Koncepcje Etykiety i notacja Dokumentacja Relacje semantyczne Mapowanie właściwości Kolekcje
Pojęcie prefLabel Uwaga szerszy broadMatch Kolekcja
ConceptScheme altLabel zmiana Uwaga węższy narrowMatch orderCollection
inScheme hiddenLabel definicja związane z relatedMatch członek
hasTopConcept notacja Uwaga redakcyjna broaderTransitive closeMatch Lista członków
topConceptOf przykład narrowerTransitive dokładne dopasowanie
historia Uwaga semanticRelation mappingRelation
zakres Uwaga

Koncepcje

Słownictwo SKOS oparte jest na pojęciach. Pojęcia są jednostkami myśli - ideami, znaczeniami lub przedmiotami i zdarzeniami (instancjami lub kategoriami) - które stanowią podstawę wielu systemów organizacji wiedzy. Jako takie, pojęcia istnieją w umyśle jako abstrakcyjne byty, które są niezależne od terminów używanych do ich oznaczania. W SKOS a Concept (na podstawie OWL Class ) jest używany do reprezentowania elementów systemu organizacji wiedzy (terminy, idee, znaczenia itp.) Lub struktury koncepcyjnej lub organizacyjnej takiego systemu.

A ConceptScheme jest analogiczne do słownictwa, tezaurusa lub innego sposobu organizowania pojęć. SKOS nie ogranicza pojęcia do określonego schematu ani nie zapewnia żadnego sposobu deklarowania pełnego schematu - nie można powiedzieć, że schemat składa się tylko z określonych elementów. TopConcept jest (jednym z) wyższym pojęciem (-ami) w hierarchicznym schemacie.

Etykiety i zapisy

Każdy SKOS label to ciąg znaków Unicode , opcjonalnie z tagami językowymi, które są powiązane z koncepcją. prefLabel Jest preferowanym ciąg czytelny dla człowieka (maksymalnie jeden na tagu językowego), natomiast altLabel mogą być wykorzystywane do alternatywnych ciągów i hiddenLabel mogą być wykorzystane do łańcuchów, które są przydatne do stowarzyszonej, ale nie oznaczało dla ludzi do czytania.

SKOS notation jest podobny do etykiety, ale ten ciąg literałowy ma typ danych, taki jak liczba całkowita, zmiennoprzecinkowa lub data; typ danych może być nawet utworzony (patrz 6.5.1 Notacje, Typed Literals i Datatypes w SKOS Reference). Notacja jest przydatna w przypadku kodów klasyfikacyjnych i innych ciągów, których nie można rozpoznać jako słowa.

Dokumentacja

Właściwości Documentation lub Note zapewniają podstawowe informacje o pojęciach SKOS. Wszystkie koncepcje są uważane za rodzaj skos:note ; po prostu dostarczają bardziej szczegółowych informacji. Na definition przykład właściwość powinna zawierać pełny opis zasobu przedmiotowego. W razie potrzeby bardziej szczegółowe typy notatek można zdefiniować w rozszerzeniu SKOS. Zapytanie dotyczące <A> skos:note ? spowoduje uzyskanie wszystkich uwag dotyczących <A>, w tym definicji, przykładów i zakresu, historii i zmian oraz dokumentacji redakcyjnej.

Każda z tych właściwości Dokumentacji SKOS może odnosić się do kilku typów obiektów: literału (np. Ciągu znaków); węzeł zasobów, który ma własne właściwości; lub odniesienie do innego dokumentu, na przykład przy użyciu identyfikatora URI. Dzięki temu dokumentacja może mieć własne metadane , takie jak data twórcy i data utworzenia.

Szczegółowe wytyczne dotyczące właściwości dokumentacji SKOS można znaleźć w Uwagach dokumentalnych SKOS Primer.

Relacje semantyczne

Relacje semantyczne SKOS mają zapewnić sposoby deklarowania relacji między pojęciami w ramach schematu pojęciowego. Chociaż nie ma ograniczeń wykluczających ich użycie z dwoma pojęciami z oddzielnych schematów, jest to odradzane, ponieważ prawdopodobnie zawyży to, co można wiedzieć o tych dwóch schematach, i być może niewłaściwie je połączy.

Właściwość related po prostu tworzy związek skojarzeniowy między dwoma pojęciami; nie zakłada się żadnej relacji hierarchii ani ogólności. Właściwości broader i narrower służą do zapewnienia bezpośredniego powiązania hierarchicznego między dwoma pojęciami. Znaczenie może być nieoczekiwane; relacja <A> broader <B> oznacza, że ​​A ma szersze pojęcie zwane B - stąd B jest szersze niż A. Węższe następuje według tego samego wzoru.

Podczas gdy przypadkowy czytelnik mógłby oczekiwać, że szersze i węższe będą właściwościami przechodnimi , SKOS nie deklaruje ich jako takich. Raczej właściwości broaderTransitive i narrowerTransitive są definiowane jako przechodnie super-właściwości szerszych i węższych. Te nadwłaściwości nie są (zgodnie z konwencją) używane w deklaratywnych instrukcjach SKOS. Zamiast tego, gdy szersza lub węższa relacja jest używana w trójce, zachodzi również odpowiednia przechodnia super-własność; a relacje przechodnie można wywnioskować (i odpytać) przy użyciu tych nadwłaściwości.

Mapowanie

Właściwości mapowania SKOS mają na celu wyrażanie dopasowania (dokładnego lub rozmytego) pojęć z jednego schematu pojęciowego do drugiego i zgodnie z konwencją są używane tylko do łączenia pojęć z różnych schematów. Pojęcia relatedMatch , broadMatch i narrowMatch to wygoda, o tym samym znaczeniu, jak właściwości semantyczne related , broader oraz narrower . (Zobacz poprzednią sekcję dotyczącą znaczenia szerszego i węższego).

Właściwość relatedMatch tworzy prostą relację skojarzeniową między dwoma pojęciami. Kiedy pojęcia są tak blisko spokrewnione, że mogą być generalnie używane zamiennie, exactMatch jest to właściwa właściwość ( exactMatch relacje są przechodnie, w przeciwieństwie do innych relacji dopasowania). closeMatch Właściwość, która wskazuje, że tylko czasami koncepcje mogą być stosowane zamiennie, a więc nie jest to własność przechodnia.

Kolekcje koncepcyjne

Zbiory pojęć ( Collection , orderedCollection ) są oznaczone i / lub uporządkowane ( orderedCollection ) grupy pojęć SKOS. Kolekcje mogą być zagnieżdżone i mogą mieć zdefiniowane identyfikatory URI lub nie (co jest znane jako pusty węzeł). Ani SKOS, Concept ani a nie ConceptScheme mogą być Kolekcją ani odwrotnie; a relacje semantyczne SKOS mogą być używane tylko z koncepcją (nie z kolekcją). Elementy w kolekcji nie mogą być połączone z innymi koncepcjami SKOS za pośrednictwem węzła kolekcji; indywidualne relacje muszą być zdefiniowane dla każdego pojęcia w kolekcji.

Społeczność i uczestnictwo

Wszystkie prace rozwojowe prowadzone są za pośrednictwem listy mailingowej, która jest całkowicie otwartą i publicznie zarchiwizowaną listą mailingową poświęconą omawianiu zagadnień związanych z systemami organizacji wiedzy, wyszukiwaniem informacji i siecią semantyczną. Każdy może nieformalnie uczestniczyć w rozwoju SKOS, dołączając do dyskusji pod adresem public-esw-thes@w3.org - nieformalne uczestnictwo jest mile widziane. Każdy, kto pracuje dla organizacji członkowskiej W3C, może formalnie uczestniczyć w procesie rozwoju, dołączając do Semantic Web Deployment Working Group - uprawnia to osoby do edycji specyfikacji i głosowania nad decyzjami dotyczącymi publikacji.

Aplikacje

Przybory

  • Unilexicon to internetowy edytor wizualny i menedżer taksonomii do tworzenia kontrolowanych słowników z integracją tagowania i JSON API. Jego podstawowa wizualizacja wykorzystuje drzewo hiperboliczne .
  • ThesauRex to internetowy edytor SKOS typu open source. Ogranicza się do szerszych / węższych relacji między pojęciami i oferuje interakcję opartą na drzewie oraz tworzenie nowych tezaurusów za pomocą tezaurusa i przeciągnij i upuść na podstawie tezaurusa głównego.
  • Inteligentny menedżer tematów firmy Mondeca (ITM) to w pełni funkcjonalne rozwiązanie zgodne ze standardem SKOS do zarządzania taksonomiami, tezaurusami i innymi kontrolowanymi słownikami.
  • Opentheso to oparty na sieci Web system zarządzania tezaurusami typu open source zgodny z normami ISO 25964: 2011 i ISO 25964-2: 2012 (Informacje i dokumentacja. Tezaurusy i współdziałanie z innymi słownikami). Oferuje eksport i import SKOS i csv, usługi sieciowe REST i SOAP oraz zarządza trwałymi identyfikatorami (ARK). Jest rozwijany we francuskim Narodowym Centrum Badań Naukowych od 2007 roku. Obecnie jest używany przez francuską sieć bibliotek archeologicznych Frantiq oraz przez zespoły badawcze i Hospices Civils de Lyon jako wspólne narzędzie zarządzania tezaurusem. Można go pobrać na github.
  • OpenSKOS to oparte na usługach internetowych podejście do publikacji, zarządzania i wykorzystania danych słownikowych, które można odwzorować na SKOS. Jego kod źródłowy jest dostępny na GitHub. Zawiera operacje CRUD podobne do RESTful na koncepcjach SKOS oraz edytor internetowy do wyszukiwania i edytowania koncepcji. Został opracowany przez Picturae i sfinansowany przez holenderskie dziedzictwo lubiące CATCHPlus.
  • TemaTres Vocabulary Server to oparty na sieci Web serwer słownictwa typu open source do zarządzania kontrolowanymi słownikami, taksonomiami i tezaurusami oraz innymi formalnymi reprezentacjami wiedzy. TemaTres zapewnia pełny eksport słowników do SKOS-core oprócz Zthes, TopicMaps, MADS, Dublin Core, VDEX, BS 8723, SiteMap, SQL i tekstu.
  • ThManager to aplikacja Java typu open source do tworzenia i wizualizacji słowników SKOS.
  • W3C zapewnia eksperymentalną usługę walidacji on-line.
  • Vocbench to internetowy edytor RDF / OWL / SKOS / SKOS-XL o otwartym kodzie źródłowym, opracowany we współpracy Organizacji Narodów Zjednoczonych do spraw Wyżywienia i Rolnictwa (FAO), Uniwersytetu Rzymskiego Tor Vergata i malezyjskiego centrum badawczego MIMOS . Obsługuje wielojęzyczny tezaurus rolniczy FAO AGROVOC , wśród innych zasobów FAO i Wspólnoty Europejskiej.
  • Pliki SKOS można również importować i edytować w edytorach RDF-OWL, takich jak Protégé , SKOS Shuttle i TopBraid Composer.
  • Synonimy SKOS można przekształcić z formatu WordNet RDF za pomocą arkusza stylów XSLT ; patrz W3C RDF
  • PoolParty to system zarządzania tezaurusami o jakości komercyjnej i edytor SKOS dla sieci semantycznej, obejmujący funkcje analizy tekstu i dane powiązane .
  • qSKOS to narzędzie typu open source do przeprowadzania oceny jakości słowników SKOS poprzez porównanie z katalogiem problemów jakościowych.
  • SKOSEd to wtyczka typu open source do edytora ontologii Protégé 4 OWL, która obsługuje tworzenie słowników SKOS. SKOSEd ma towarzyszące API SKOS napisane w Javie, które można wykorzystać do tworzenia aplikacji opartych na SKOS.
  • Model Futures SKOS Exporter dla Microsoft Excel umożliwia tworzenie prostych słowników w postaci arkuszy kalkulacyjnych Excel z wcięciami i eksportowanie ich jako SKOS RDF. Wersja beta.
  • Lexaurus to system zarządzania tezaurusami dla przedsiębiorstw i edytor wieloformatowy. Jego rozbudowane API obejmuje pełne zarządzanie wersjami. SKOS jest jednym z wielu obsługiwanych formatów.
  • SKOS Shuttle to usługa zarządzania tezaurusami, która umożliwia użytkownikom importowanie, utrzymywanie, przetwarzanie i synchronizację tezaurusów w SKOS przy użyciu specjalnych rozszerzeń SKOS.
  • TopBraid Enterprise Vocabulary Net (EVN) i TopBraid Enterprise Data Governance (EDG) to rozwiązania internetowe, które wspierają tworzenie i zarządzanie połączonymi ze sobą kontrolowanymi słownikami, takimi jak taksonomie, tezaurusy, glosariusze biznesowe i ontologie. Obsługiwane są SKOS i SKOS-XL.
  • Thesaurus Master, do tworzenia, rozwijania i utrzymywania taksonomii i tezaurusów, jest częścią linii oprogramowania do zarządzania wiedzą Data Harmony firmy Access Innovations. Oferuje eksport zgodny ze standardem SKOS.
  • Fluent Editor 2014 - edytor ontologiczny, który umożliwia użytkownikom pracę i edycję bezpośrednio adnotacji OWL i SKOS. Adnotacje będą przetwarzane również dla przywoływanych ontologii, a także importowane / eksportowane do OWL / RDF i mogą być przetwarzane na serwerze.
  • Smartlogic Semaphore Ontology Editor - edytor ontologiczny oparty na SKOS i SKOS-XL, który umożliwia tworzenie modeli w oparciu o standardy SKOS.

Dane

Istnieją publicznie dostępne źródła danych SKOS.

  • Wiki SKOS Datasets W3C zaleca korzystanie z tej listy publicznie dostępnych źródeł danych SKOS. Większość danych znalezionych na tej wiki można wykorzystać do zastosowań komercyjnych i badawczych.

Relacje z innymi standardami

Metamodel

Metamodel SKOS jest zasadniczo zgodny z modelem danych ISO 25964-1 - Thesauri for Information Retrieval. Ten model danych można wyświetlić i pobrać ze strony internetowej dla ISO 25964 .

Model semantyczny elementów informacyjnych SKOS

Standardy tezaurusa

W rozwój SKOS zaangażowani byli eksperci zarówno ze środowiska RDF, jak i biblioteki, a SKOS zamierza umożliwić łatwą migrację tezaurusów zdefiniowanych przez standardy takie jak NISO Z39.19 - 2005 czy ISO 25964 .

Inne standardy sieci semantycznej

SKOS ma zapewnić sposób na udostępnienie spuścizny schematów koncepcyjnych aplikacjom sieci semantycznej, prostszy niż bardziej złożony język ontologii OWL . OWL ma na celu wyrażanie złożonych struktur koncepcyjnych, które mogą być używane do generowania bogatych metadanych i obsługi narzędzi wnioskowania. Jednak tworzenie przydatnych ontologii sieciowych jest wymagające pod względem wiedzy fachowej, wysiłku i kosztów. W wielu przypadkach ten rodzaj wysiłku może być zbędny lub nieodpowiedni do wymagań, a SKOS może być lepszym wyborem. Rozszerzalność RDF umożliwia dalsze włączanie lub rozszerzanie słowników SKOS w bardziej złożone słowniki, w tym ontologie OWL.

Zobacz też

Bibliografia

Linki zewnętrzne