Wikidane - Wikidata

Wikidane
Wikidata-logo-pl.svg
Zrzut ekranu
Strona główna Wikidanych screenshot.png
Strona główna Wikidanych w kwietniu 2021 r.
Rodzaj strony
Dostępne w Wiele języków
Właściciel Fundacja Wikimedia
Redaktor Społeczność Wikimedia
URL www .wikidata .org Edytuj to na Wikidata
Handlowy Nie
Rejestracja Opcjonalny
Wystrzelony 29 października 2012 r .; 8 lat temu ( 2012-10-29 )

Wikidata to wielojęzyczny wykres wiedzy opracowany wspólnie przez Fundację Wikimedia . Jest to powszechne źródło otwartych danych, z których projekty Wikimedia, takie jak Wikipedia i każdy inny, mogą korzystać na podstawie licencji domeny publicznej CC0 . Wikidata to wiki oparte na oprogramowaniu MediaWiki , a także oparte na zestawie rozszerzeń MediaWiki , znanym jako Wikibase .

Pojęcie

Ten diagram pokazuje najważniejsze terminy używane w Wikidanych.

Wikidata to baza danych zorientowana na dokumenty , skupiająca się na elementach reprezentujących dowolny temat, koncepcję lub obiekt. Każdej pozycji przypisywany jest unikalny, trwały identyfikator , dodatnia liczba całkowita poprzedzona wielką literą Q, znana jako „QID”. Umożliwia to przetłumaczenie podstawowych informacji wymaganych do zidentyfikowania tematu, którego dotyczy dany element, bez faworyzowania żadnego języka.

Przykłady pozycji obejmują Letnie Igrzyska Olimpijskie 1988 (Q8470) , love (Q316) , Johnny Cash (Q42775) , Elvis Presley (Q303) i Gorilla (Q36611) .

Etykiety produktów nie muszą być niepowtarzalne. Na przykład istnieją dwa przedmioty o nazwie „Elvis Presley”: Elvis Presley (Q303) , który reprezentuje amerykańskiego piosenkarza i aktora , oraz Elvis Presley (Q610926) , który reprezentuje jego album zatytułowany sam . Jednak połączenie etykiety i jej opisu musi być niepowtarzalne. Aby uniknąć niejasności, unikalny identyfikator produktu ( QID ) jest zatem powiązany z tą kombinacją.

Typy przedmiotów to ogólne i leksemy.

Główne części

Zrzut ekranu Wikidanych


Układ czterech głównych komponentów strony Wikidanych fazy 1: etykieta, opis, aliasy i linki międzyjęzykowe.

Zasadniczo przedmiot składa się z:

  • Obowiązkowo identyfikator (QID) powiązany z etykietą i opisem.
  • Opcjonalnie wiele aliasów i pewna liczba instrukcji (oraz ich właściwości i wartości).

Sprawozdania

Zrzut ekranu Wikidanych
Trzy stwierdzenia z pozycji Wikidanych o planecie Mars (Q111). Wartości obejmują linki do innych pozycji oraz do Wikimedia Commons .

Oświadczenia to sposób, w jaki wszelkie znane informacje o elemencie są zapisywane w Wikidanych. Formalnie składają się z par klucz-wartość , które odpowiadają właściwości (np. „autor” lub „data publikacji”) z co najmniej jedną wartością jednostki (np. „ Sir Arthur Conan Doyle ” lub „1902”). Na przykład nieformalne stwierdzenie w języku angielskim „mleko jest białe” zostałoby zakodowane przez stwierdzenie parujące kolor właściwości (P462) z wartością biały (Q23444) pod pozycją mleko (Q8495) .

Instrukcje mogą mapować właściwość na więcej niż jedną wartość. Na przykład własność „zawód” Marii Curie może być powiązana z wartościami „fizyk” i „chemik”, aby odzwierciedlić fakt, że zajmowała się obydwoma zawodami.

Wartości mogą przyjmować wiele typów, w tym inne elementy Wikidanych, ciągi, liczby lub pliki multimedialne. Właściwości określają, z jakimi typami wartości mogą być sparowane. Na przykład oficjalna strona internetowa usługi (P856) może być sparowana tylko z wartościami typu „URL”.

Własność i wartość

Przykład prostego stwierdzenia składającego się z jednej pary właściwość-wartość

Metoda strukturyzowania danych stosowana przez Wikidata obejmuje dwa główne elementy: właściwości i wartości tych właściwości (zwanych w terminologii Wikidanych „elementami”).

Właściwość opisuje wartość danych w oświadczeniu i może być traktowana jako kategoria danych, na przykład kolor (P462) w przypadku wartości danych niebieski (Q1088) lub wykształcenie w przypadku elementu dotyczącego osoby.

Jak już wspomniano, właściwości w połączeniu z wartościami tworzą oświadczenie w Wikidanych.

Najczęściej używaną właściwością jest cytowanie pracy (P2860) , która jest wykorzystywana na ponad 210 000 000 stronach pozycji.

Właściwości mają swoje własne strony w Wikidanych, a ponieważ element może zawierać kilka właściwości, skutkuje to połączoną strukturą danych stron pod tym samym stwierdzeniem.

Właściwości mogą również definiować bardziej złożone reguły dotyczące ich zamierzonego użycia, zwane ograniczeniami . Na przykład własność stolicy (P36) zawiera „ograniczenie pojedynczej wartości”, odzwierciedlające rzeczywistość, w której (zazwyczaj) terytoria mają tylko jedną stolicę. Ograniczenia są traktowane jako testujące alerty i podpowiedzi, a nie nienaruszalne zasady.

Opcjonalnie kwalifikatory mogą służyć do doprecyzowania znaczenia instrukcji przez podanie dodatkowych informacji, które dotyczą zakresu instrukcji, w ramach wartości. Na przykład właściwość „populacja” można zmodyfikować za pomocą kwalifikatora, takiego jak „stan na 2011 r.”. Wartości w instrukcjach mogą być również opatrzone adnotacjami z odwołaniami , wskazującymi na źródło kopii zapasowej zawartości instrukcji.

leksemy

W językoznawstwie , A leksem jest jednostką leksykalnego znaczenia. Podobnie leksemy Wikidanych to elementy o strukturze, która czyni je bardziej odpowiednimi do przechowywania danych leksykograficznych . Oprócz przechowywania języka, do którego odnosi się leksem, mają sekcję na formy i sekcję na zmysły .

Schematy encji

W styczniu 2019 rozpoczęto prace nad nowym rozszerzeniem MediaWiki, które umożliwia przechowywanie wyrażeń Shape w oddzielnej przestrzeni nazw.

To rozszerzenie zostało już zainstalowane na Wikidanych i umożliwia współtwórcom używanie wyrażeń kształtu do walidacji i opisywania danych Resource Description Framework w elementach i leksemach. Każdy element lub leksem na Wikidanych może być zweryfikowany względem schematu encji, co czyni go ważnym narzędziem do zapewniania jakości.

Rozwój

Stworzenie projektu zostało sfinansowane z darowizn z Allen Institute for Artificial Intelligence , Gordon and Betty Moore Foundation oraz Google, Inc. na łączną kwotę 1,3 miliona euro. Rozwój projektu jest głównie napędzany przez Wikimedia Deutschland pod kierownictwem Lydii Pintscher i pierwotnie był podzielony na trzy fazy:

  1. Centralizacja linków międzyjęzykowych — linki między artykułami Wikipedii na ten sam temat w różnych językach.
  2. Zapewnienie centralnego miejsca na dane infoboksu dla wszystkich Wikipedii.
  3. Tworzenie i aktualizowanie artykułów na listach w oparciu o dane z Wikidanych i linkowanie do innych siostrzanych projektów Wikimedia, w tym Meta-Wiki i własnych Wikidanych (interwikilinks).

Wstępne wdrożenie

Zrzut ekranu Wikipedii


Lista linków międzyjęzykowych artykułu w Wikipedii, które pojawiły się w polu edycji (po lewej) i na stronie artykułu (po prawej) przed Wikidata. Każdy link na tych listach prowadzi do artykułu, który wymaga własnej listy linków międzyjęzykowych do innych artykułów; to są informacje scentralizowane przez Wikidata.
Zrzut ekranu Wikidanych
„Edytuj linki” link dzisiaj zabiera czytelnika do wikidane aby edytować interjęzyk i interwiki linki.

Wikidata została uruchomiona 29 października 2012 roku i była pierwszym nowym projektem Fundacji Wikimedia od 2006 roku. W tym czasie dostępna była tylko centralizacja linków językowych. Umożliwiło to tworzenie elementów i wypełnianie ich podstawowymi informacjami: etykietą – nazwą lub tytułem, aliasami – alternatywnymi terminami dla etykiety, opisem i linkami do artykułów na dany temat we wszystkich wersjach językowych Wikipedii (linki do interwikipedii) .

Historycznie rzecz biorąc, artykuł w Wikipedii zawierałby listę linków międzyjęzykowych , będących linkami do artykułów na ten sam temat w innych wydaniach Wikipedii, jeśli takie istniały. Początkowo Wikidata była samodzielnym repozytorium linków międzyjęzykowych. Edycje językowe Wikipedii nadal nie miały dostępu do Wikidanych, więc musieli nadal utrzymywać własne listy linków międzyjęzykowych, głównie na końcu stron artykułów.

14 stycznia 2013 r. węgierska Wikipedia jako pierwsza umożliwiła udostępnianie linków międzyjęzykowych za pośrednictwem Wikidanych. Funkcjonalność ta została rozszerzona na hebrajską i włoską Wikipedię 30 stycznia, angielską Wikipedię 13 lutego i wszystkie inne Wikipedie 6 marca. Gdy nie osiągnięto konsensusu w sprawie propozycji ograniczenia usuwania linków językowych z angielskiej Wikipedii, uprawnienia do usuwania ich z angielskiej Wikipedii przyznano automatycznym edytorom ( botom ). 23 września 2013 r. na Wikimedia Commons pojawiły się linki międzyjęzykowe.

Oświadczenia i dostęp do danych

4 lutego 2013 r. do wpisów Wikidanych zostały wprowadzone oświadczenia. Możliwe wartości właściwości były początkowo ograniczone do dwóch typów danych (elementy i obrazy na Wikimedia Commons), a później więcej typów danych (takich jak współrzędne i daty). Pierwszy nowy typ, string, został wdrożony 6 marca.

Zdolność do różnych wersjach językowych Wikipedii dostępu do danych z wikidane był wdrażany stopniowo między 27 marca a 25 kwietnia 2013. W dniu 16 września 2015 r wikidane zaczął pozwalając tzw arbitralnego dostępu lub dostęp z danego artykułu z Wikipedii oświadczenia o elementach Wikidanych, które nie są z nim bezpośrednio połączone. Na przykład stało się możliwe odczytanie danych o Niemczech z artykułu berlińskiego, co wcześniej nie było możliwe. 27 kwietnia 2016 r. dowolny dostęp został aktywowany na Wikimedia Commons.

Według badania z 2020 r. duża część danych w Wikidanych to wpisy masowo importowane z innych baz danych przez boty internetowe , co pomaga „przełamać mury” silosów danych .

Obsługa zapytań i inne ulepszenia

7 września 2015 r. Fundacja Wikimedia ogłosiła wydanie usługi Wikidata Query Service, która umożliwia użytkownikom uruchamianie zapytań dotyczących danych zawartych w Wikidata. Usługa używa języka SPARQL jako języka zapytań. Od listopada 2018 r. istnieje co najmniej 26 różnych narzędzi, które umożliwiają odpytywanie danych na różne sposoby.

Z drugiej strony, w bocznym panelu Wikisłownika, narzędzia zawierają teraz "element Wikidanych", który pomaga tworzyć nowy element i linki do nowych stron. Na przykład jest to przydatne, gdy element jest tylko w angielskim Wikisłowniku i musi być powiązany z innym projektem Wikimedia, a nie z Wikisłownikami w innych językach.

Poniżej znajduje się przykład SPARQL do wyszukiwania wystąpienia (P31) serialu telewizyjnego (Q5398426) z głównym tematem (P921) dotyczącym wyspy (Q23442) i wypadku lotniczego (Q744913). Jednak podobne wyniki można również znaleźć bezpośrednio w Wikipedii, korzystając z przecięć kategorii, jeśli odpowiednie kategorie istnieją i są dozwolone.

SELECT ?item ?itemLabel
WHERE {
  ?item wdt:P31 wd:Q5398426.
  ?item wdt:P921 wd:Q23442.
  ?item wdt:P921 wd:Q744913.
  SERVICE wikibase:label {bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en".}
}

Poniżej znajduje się kolejny przykład SPARQL, aby znaleźć instancję (P31) serialu telewizyjnego (Q5398426), w którym członkiem obsady (P161) są Daniel Dae Kim (Q299700) i Jorge Garcia (Q264914). Stan serialu telewizyjnego uniemożliwia wyświetlenie odcinka serialu telewizyjnego (Q21191270) / odcinka dwuczęściowego (Q21664088) i nie pokazuje wyników, które dotyczą filmu (Q11424).

SELECT ?item ?itemLabel
WHERE {
  ?item wdt:P31 wd:Q5398426.
  ?item wdt:P161 wd:Q299700.
  ?item wdt:P161 wd:Q264914.
  SERVICE wikibase:label {bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en".}
}

Kreski logo zawierają słowo „WIKI” zakodowane alfabetem Morse'a . Został stworzony przez Aruna Ganesha i wybrany decyzją społeczności.

Przyjęcie

W listopadzie 2014 r. Wikidata otrzymała nagrodę Open Data Publisher Award od Open Data Institute „za samą skalę i wbudowaną otwartość”.

Od listopada 2018 r. informacje z Wikidanych były wykorzystywane w 58,4% wszystkich anglojęzycznych artykułów Wikipedii, głównie w przypadku identyfikatorów zewnętrznych lub lokalizacji współrzędnych. Łącznie dane z Wikidanych są wyświetlane w 64% wszystkich stron Wikipedii , 93% wszystkich artykułów Wikivoyage , 34% wszystkich Wikicytatów , 32% wszystkich Wikiźródeł i 27% Wikimedia Commons. Wykorzystanie w innych projektach Fundacji Wikimedia jest świadectwem.

Do grudnia 2020 r. dane Wikidanych były wizualizowane przez co najmniej 20 innych zewnętrznych narzędzi, a na temat Wikidanych opublikowano ponad 300 artykułów.

Ustrukturyzowany zbiór danych Wikidata był używany przez wirtualnych asystentów, takich jak Siri firmy Apple i Amazon Alexa .

Aplikacje

  • Rozszerzenie Mwnci może importować dane z Wikidanych do arkuszy kalkulacyjnych LibreOffice Calc
  • Prowadzone są (w październiku 2019 r.) dyskusje na temat używania elementów QID w związku z tym, co nazywa się emoji QID
  • Wiki Explorer – aplikacja na Androida do odkrywania rzeczy wokół Ciebie i mikroedycji Wikidanych
  • KDE Itinerary – dbający o prywatność asystent podróży typu open source, który wykorzystuje dane z Wikidanych

Zobacz też

Bibliografia

Dalsza lektura

Zewnętrzne linki