Skrzynka informacyjna - Infobox
Na wiki , infobox to tabela służąca do zbierania i prezentowania podzbioru informacji na jego temat, na przykład dokumentu . Jest to ustrukturyzowany dokument zawierający zestaw par atrybut-wartość , a w Wikipedii przedstawia podsumowanie informacji o temacie artykułu . W ten sposób są one pod pewnymi względami porównywalne z tabelami danych . Gdy jest prezentowany w większym dokumencie, który podsumowuje, infobox jest często prezentowany w formacie paska bocznego .
Infobox może zostać zaimplementowany w innym dokumencie poprzez transkluzję go do tego dokumentu i określenie niektórych lub wszystkich par atrybut-wartość powiązanych z tym infoboksem, znanych jako parametryzacja .
Wikipedia
Infobox może służyć do podsumowania informacji o artykule w Wikipedii . Są one używane w podobnych artykułach, aby zapewnić spójność prezentacji przy użyciu wspólnego formatu. Pierwotnie infoboksy (i ogólnie szablony) były używane do celów układu strony . Infobox może zostać przekształcony w artykuł poprzez określenie wartości niektórych lub wszystkich jego parametrów . Użyta nazwa parametru musi być taka sama, jak określona w szablonie infoboksu, ale może być z nim powiązana dowolna wartość. Nazwa jest oddzielona od wartości znakiem równości . Nazwa parametru może być traktowana jako atrybut tematu artykułu.
{{Infobox prepared food | name = | image = | imagesize = | caption = | alternate_name = | country = | region = | creator = | course = | type = | served = | main_ingredient = | variations = | calories = | other = }} |
{{Infobox prepared food
| name = Crostata
| image = Crostata limone e zenzero 3.jpg
| imagesize =
| caption = Crostata with lemon ginger filling
| alternate_name =
| country = [[Italy]]
| region = [[Lombardia]]
| creator =
| course = [[Dessert]]
| type = [[Tart]]
| served =
| main_ingredient = Pastry crust, [[jam]] or [[ricotta]], fruit
| variations = ''Crostata di frutta'', ''crostata di ricotta'', many other sweet or savoury variations
| calories =
| other =
}}
|
Infobox Infobox przygotowane jedzenie używany Wikipedia artykułów związanych z żywnością, bez wartości określone dla jego parametrów (atrybutów). | Taki sam infobox jak zaimplementowany w artykule crostata . Zauważ, że wartości znajdują się na prawo od znaku równości (=) i że nazwy parametrów są takie same jak te w specyfikacji szablonu infoboksu. Wartości znajdują się w znacznikach wiki : wpisy ujęte w nawiasy kwadratowe (np. [[Tart]]) będą renderowane jako łącze do odpowiedniego artykułu Wikipedii (np. Tart ), a połączony plik zostanie przeniesiony do artykułu zamiast jego narzut. |
W Wikipedii infobox jest przekształcany w artykuł, umieszczając jego nazwę i pary atrybut-wartość w podwójnym zestawie nawiasów klamrowych . MediaWiki oprogramowanie, na którym działa Wikipedia następnie analizuje dokument, dla którego infobox i inne szablony są przetwarzane przez procesor szablonu . Jest to silnik szablonów, który tworzy dokument internetowy i arkusz stylów używany do prezentacji dokumentu. Umożliwia to oddzielenie projektu infoboksu od treści, którymi manipuluje; oznacza to, że projekt szablonu może być aktualizowany bez wpływu na zawarte w nim informacje, a nowy projekt zostanie automatycznie rozpowszechniony we wszystkich artykułach, które transkludują infoboks. Zazwyczaj infoboks są sformatowane tak, aby pojawiały się w prawym górnym rogu artykułu Wikipedii w widoku na komputery lub na górze w widoku mobilnym.
Umieszczenie infoboksu w wikitekście artykułu jest ważne dla dostępności . Najlepszą praktyką jest umieszczenie im następujące ujednoznaczniających szablonów (tych, które kierują czytelników do artykułów na tematy o podobnych nazwach) i szablonów alimentacyjnych (takich jak, że oznakowanie artykuł jako przypisań), ale przed wszystkimi innymi zawartości .
Baeza-Yates i King twierdzą, że niektórzy redaktorzy uważają szablony, takie jak infoboks, za skomplikowane, ponieważ szablon może ukrywać tekst o właściwości lub zasobie, które redaktor chce zmienić; jest to pogarszane przez szablony powiązane, to znaczy szablony transkludowane w ramach innych szablonów.
W sierpniu 2009 r. angielska Wikipedia używała około 3000 szablonów infoboksów, które łącznie wykorzystywały ponad 20 000 atrybutów. Od tego czasu wiele z nich zostało połączonych w celu zmniejszenia nadmiarowości. Według stanu na czerwiec 2013 r. było co najmniej 1 345 446 transkluzji nadrzędnego szablonu Infoboksa , używanego przez niektóre, ale nie wszystkie, infoboksy w 4 251 127 artykułów.
Nazwa Infoboksa to zazwyczaj „Infobox [gatunek]”; jednak powszechnie używanym infoboksom można przypisać krótsze nazwy, takie jak "taxobox" dla taksonomii.
Nauczanie maszynowe
Około 44,2% artykułów w Wikipedii zawierało infoboks w 2008 r. i około 33% w 2010 r. Zautomatyzowana ekstrakcja wiedzy semantycznej przy użyciu algorytmów uczenia maszynowego służy do „wydobycia informacji przetwarzalnych maszynowo przy stosunkowo niskich kosztach złożoności”. Jednak niski zasięg sprawia, że jest to trudniejsze, choć można to częściowo przezwyciężyć, uzupełniając dane o wyrobach danymi z kategorii, w których dany wyrób jest uwzględniony. Francuski Wikipedii zainicjowała projekt Infobox Version 2 w maju 2011 roku.
Wiedza uzyskana dzięki uczeniu maszynowemu może zostać wykorzystana do ulepszenia artykułu, na przykład poprzez użycie automatycznych sugestii oprogramowania dla redaktorów w celu dodania danych infoboksu. Projekt iPopulator stworzył system dodawania wartości do parametru infobox artykułu poprzez automatyczne parsowanie tekstu tego artykułu.
DBpedia wykorzystuje ustrukturyzowaną zawartość wyodrębnioną z infoboksów przez algorytmy uczenia maszynowego do utworzenia zasobu połączonych danych w sieci semantycznej ; został opisany przez Tima Bernersa-Lee jako „jeden z bardziej znanych” komponentów projektu danych połączonych.
Ekstrakcja maszynowa tworzy trójkę składającą się z podmiotu, predykatu lub relacji i przedmiotu. Każda para atrybut-wartość w infoboksie jest używana do tworzenia instrukcji RDF przy użyciu ontologii . Sprzyja temu mniejsza przepaść między Wikipedią a ontologią niż między nieustrukturyzowanym lub wolnym tekstem a ontologią.
Semantyczny związek pomiędzy przedmiotem i celem ustala orzeczenia. W przykładowym infoboksie, trójka ("crostata", type, "tart") wskazuje, że crostata jest rodzajem tart . Temat artykułu jest używany jako temat, nazwa parametru jest używana jako predykat, a wartość parametru jako obiekt. Każdy typ infoboksu jest mapowany na klasę ontologii, a każda właściwość (parametr) w infoboksie jest mapowana na właściwość ontologii. Te mapowania są używane podczas analizowania artykułu Wikipedii w celu wyodrębnienia danych.
Cytaty
Ogólne odniesienia
- Baeza-Yates, Ricardo; Król, Irwin, wyd. (2009). Usługi tkackie i ludzie w sieci WWW . Skoczek. Numer ISBN 9783642005695. LCCN 2009926100 .
- Broughton, John (14.07.2008). fryzjer, Nan; Meyers, Peter (red.). Wikipedia – brakujący podręcznik . O'Reilly Media . Numer ISBN 9780596553777.
- Geertmana, Stana; Reinhardt, Wolfgang; Toppen, Fred, wyd. (2011). Rozwój nauki o geoinformacji dla zmieniającego się świata . Notatki z wykładów z geoinformacji i kartografii. 1 . Skoczek. doi : 10.1007/978-3-642-19789-5 . Numer ISBN 9783642197888. ISSN 1863-2246 . LCCN 2011925152 .
- Langego, Dustina; Böhm, Christoph; Naumann, Feliks (2010). Wydobywanie uporządkowanych informacji z artykułów Wikipedii w celu zapełnienia infoboksów . Technische Berichte des Hasso-Plattner-Institut für Softwaresystemtechnik an der Universität Potsdam, Hasso-Plattner-Institut für Softwaresystemtechnik Potsdam . Universitätsverlag Potsdam. Numer ISBN 9783869560816.
- Yu, Liyang (2011). Przewodnik programisty po sieci semantycznej . Skoczek. doi : 10.1007/978-3-642-15970-1 . Numer ISBN 9783642159695.
- Miller, Paweł (2008-02-07). „Sir Tim Berners-Lee rozmawia z Talisem o sieci semantycznej” . Transkrypcja przez CastingWords. Grupa Talis. Zarchiwizowane od oryginału w dniu 2013-05-10 . Źródło 2013-06-02 .
- Virvou, Maria; Matsuura, Saeko, wyd. (2012). Inżynieria oprogramowania oparta na wiedzy: materiały z dziesiątej wspólnej konferencji na temat inżynierii oprogramowania opartej na wiedzy . Granice a sztuczna inteligencja i aplikacje . 240 . IOS Naciśnij. Numer ISBN 9781614990932. LCCN 2012943674 .
Dalsza lektura
- Kiran, Kumar N.; Santosh, GSK; Varma, Vasudeva (czerwiec 2011). „Wielojęzyczne grupowanie dokumentów przy użyciu Wikipedii jako wiedzy zewnętrznej” . Pozyskiwanie informacji multidyscyplinarnych . Notatki z wykładów z informatyki. Springer Berlin Heidelberg. 6653 . doi : 10.1007/978-3-642-21353-3 . Numer ISBN 9783642213533. ISSN 0302-9743 . S2CID 9901886 .
- Chutiporn, Anutariya; Domingue, John, wyd. (2008). The Semantic Web: 3. Azjatycka Konferencja Sieci Semantycznej, ASWC 2008, Bangkok, Tajlandia, 8-11 grudnia 2008. Proceedings . Notatki z wykładów z informatyki . 5367 . Skoczek. Numer ISBN 9783540897033. ISSN 0302-9743 .
- Wu, Fei; Hoffmanna, Ralpha; Weld, Daniel s. (2008). „Ekstrakcja informacji z Wikipedii: poruszanie się po długim ogonie”. Materiały XIV Międzynarodowej Konferencji ACM SIGKDD nt. odkrywania wiedzy i eksploracji danych . Stowarzyszenie na rzecz Maszyn Komputerowych : 731-739. doi : 10.1145/1401890.1401978 . Numer ISBN 9781605581934. S2CID 7781746 .