Odlewnia OBO - OBO Foundry

Odlewnia OBO
Centrum Poprawa ontologii biomedycznych
Członkowie
27
Kluczowi ludzie
Suzanna Lewis , Barry Smith , Michael Ashburner
Strona internetowa obofoundry .org

Otwarte biologiczne i biomedyczne Ontologie ( OBO ) Foundry to grupa ludzi przeznaczonych do budowania i utrzymywania ontologii związanych z nauk o życiu . Odlewnia OBO ustanawia zestaw zasad rozwoju ontologii w celu stworzenia zestawu interoperacyjnych ontologii referencyjnych w dziedzinie biomedycznej. Obecnie istnieje ponad sto ontologii zgodnych z zasadami OBO Foundry .

Wysiłek Odlewni OBO ułatwia integrację wyników biomedycznych i przeprowadzanie analiz w bioinformatyce . Czyni to poprzez oferowanie ustrukturyzowanego odniesienia dla terminów z różnych dziedzin badawczych i ich wzajemnych powiązań (np. fenotyp w modelu mysim i powiązany z nim fenotyp u danio pręgowanego ).

Wstęp

Inicjatywa Foundry ma na celu poprawę integracji danych w naukach przyrodniczych. Jednym z podejść do integracji jest adnotacja danych z różnych źródeł przy użyciu kontrolowanych słowników . Najlepiej byłoby, gdyby takie kontrolowane słowniki miały formę ontologii , które wspierają logiczne rozumowanie nad danymi, które są adnotowane przy użyciu terminów w słowniku.

Formalizacja pojęć w dziedzinie biomedycznej jest szczególnie znana dzięki pracom Gene Ontology Consortium, części Odlewni OBO. Doprowadziło to do opracowania pewnych proponowanych zasad dobrej praktyki w rozwoju ontologii, które są obecnie wprowadzane w życie w ramach konsorcjum Otwartych Ontologii Biomedycznych poprzez inicjatywę OBO Foundry. Ontologie OBO stanowią część zasobów Narodowego Centrum Ontologii Biomedycznej , gdzie stanowią centralny element BioPortalu NCBO.

Otwarte ontologie biologiczne i biomedyczne

Open Biological and Biomedical Ontologies (OBO; dawniej Open Biomedical Ontologies) to próba stworzenia ontologii ( kontrolowanych słowników ) do użytku w dziedzinach biologicznych i medycznych. Podzbiór oryginalnych ontologii OBO założył Odlewnię OBO, która kieruje działaniami OBO od 2007 roku.

Stworzenie OBO w 2001 roku było w dużej mierze inspirowane wysiłkami projektu Gene Ontology . OBO stanowi część zasobów amerykańskiego Narodowego Centrum Ontologii Biomedycznej (NCBIO) i centralny element BioPortalu NCBO. Jest to inicjatywa prowadzona przez Odlewnię OBO.

Zasady uczestnictwa

Odlewnia OBO jest otwarta na udział wszystkich zainteresowanych osób. Ontologie, które mają być oficjalnie częścią Odlewni OBO, muszą być zgodne z zasadami OBO i przejść szereg recenzji dokonanych przez członków, podczas gdy „koordynatorzy Odlewni służą jako odpowiedniki redaktorów czasopism”. Istnieją ontologie, które są zgodne z zasadami OBO, ale nie są oficjalnie częścią OBO, takie jak eagle-i 's Reagent Application Ontology. i Zwierzęta w Ontologii Kontekstowej.

Zaproponowano włączenie do OBO teorii sztywności OntoClean jako kroku w kierunku standaryzacji kandydujących ontologii. Taka integracja ułatwiłaby tworzenie oprogramowania do automatycznego sprawdzania kandydatów.

Narzędzia

Społeczność OBO Foundry zajmuje się również opracowywaniem narzędzi ułatwiających tworzenie i utrzymywanie ontologii. Większość programistów ontologii w OBO używa edytora ontologii Protégé i języka OWL ( Web Ontology Language ) do budowania ontologii. Aby ułatwić zarządzanie ontologiami z linii poleceń w formacie zgodnym z Protégé i OWL, odlewnia OBO opracowała narzędzie ROBOT (ROBOT to narzędzie OBO). ROBOT agreguje funkcje do rutynowych zadań w rozwoju ontologii, jest oprogramowaniem typu open source i może być używany za pośrednictwem wiersza poleceń lub jako biblioteka dla dowolnego języka w wirtualnej maszynie Java .

Innym narzędziem związanym z wysiłkiem OBO jest OBO-Edit , edytor ontologiczny i wnioskujący finansowany przez Gene Ontology Consortium . Istnieją również wtyczki do OBO-Edit, które ułatwiają tworzenie ontologii, takie jak półautomatyczny generator ontologii DOG4DAG.

Format pliku OBO

Format pliku OBO to zorientowany na biologię język do budowania ontologii. Opiera się na zasadach Języka Ontologii Sieciowej (OWL) .

Jako wysiłek społeczności stworzono standardowe wspólne mapowania dla bezstratnych transformacji w obie strony między formatem Open Biomedical Ontologies (OBO) a OWL. Badanie obejmuje metodyczne zbadanie każdego z konstruktów OBO oraz tortu warstwowego dla OBO, podobnego do stosu Semantic Web.

Ontologie odlewnicze OBO

Początkowy zestaw ontologii OBO Foundry składał się z dojrzałych ontologii (takich jak Gene Ontology , GO i Foundational Model of Anatomy , FMAO), poprzez połączenie wcześniej istniejących ontologii (np. Cell Ontology, CL, utworzonej z różnych ontologie i powiązane części na GO i FMAO) oraz poprzez rozwój nowych ontologii opartych na jego zasadach.

Oryginalny zestaw ontologii obejmował również danio anatomiczna Ontologia (część z danio Information Network ), The Chebi ontologii z Ontologia Disease , z roślin Ontologia , The Sequence Ontologia , w Ontologia dla Biomedical Badania i białko Ontologia .

Liczba ontologii w OBO wzrosła do rzędu setek i są one zebrane na liście ontologii OBO Foundry .

Odlewnia OBO i Wikidane

Wiele różnych ontologii OBO Foundry zostało również zintegrowanych z wykresem wiedzy Wikidanych . Doprowadziło to do integracji ustrukturyzowanych ontologii OBO z danymi z innych baz danych innych niż OBO. Na przykład integracja Ontologii Chorób Człowieka z Wikidata umożliwiła jej połączenie z opisem linii komórkowych z zasobu Cellosaurus . Jednym z celów integracji OBO Foundry z Wikidata jest obniżenie barier dla nie-ontologów, którzy mogą wnosić wkład i korzystać z ontologii. Wikidane są prawdopodobnie łatwiejsze do zrozumienia i wykorzystania niż tradycyjne modele ontologiczne (które wymagają wysokiego stopnia specjalistycznej wiedzy).

Zasady

Podsumowanie Zasad Odlewniczych OBO dotyczących opracowania ontologii nauk przyrodniczych zgodnej z OBO :

Otwartość

Ontologie są publicznie dostępne i muszą być wydane na licencji CC-BY 3.0 lub w domenie publicznej ( CC0 ). Otwartość ontologii umożliwiła na przykład import terminów z Gene Ontology (jednej z ontologii zgodnych z Zasadami OBO) do projektu Wikidata .

Wspólny format

Ontologie muszą być dostępne we wspólnym języku formalnym . W praktyce oznacza to, że ontologie, które są częścią odlewni OBO, muszą opisywać elementy bez formatów OWL/ OWL2 lub OBO przy użyciu składni RDF/XML, aby zmaksymalizować interoperacyjność.

Ortogonalność

Mapowanie z identyfikatorów OBO na ujednolicone identyfikatory zasobów OBO (URI), unikalne dla każdego elementu.

Terminy powinny być unikatowe w przestrzeni OBO, co oznacza, że ​​każdy element ma unikalny prefiks ontologiczny (np. CHEBI , GO , PRO ) i lokalny identyfikator numeryczny w obrębie ontologii. Wybór identyfikatora numerycznego został dokonany w celu usprawnienia utrzymania i ewolucji zasobów. Aby uczestniczyć w OBO Foundry, ontologie muszą być ortogonalne, a koncepcje, które modelują, muszą być unikalne w OBO, więc każda koncepcja ma jeden uniwersalny identyfikator zasobów (URI). Nowe ontologie muszą zatem ponownie wykorzystać pracę wykonaną w innych wysiłkach.

Pomimo ideału unikalności terminów i interoperacyjności, w praktyce jest to trudne do wyegzekwowania, co prowadzi do występowania powielania terminów. Co więcej, niektóre ontologie nie wykorzystują ponownie terminów, a nawet niewłaściwie wykorzystują terminy.

Wersjonowanie

Ontologie ewoluują w czasie, dopracowując koncepcje i opisy zgodnie z postępem wiedzy w ich specyficznych dziedzinach. Aby mieć pewność, że nowe wersje są aktualizowane, ale narzędzia korzystające ze starszych wersji ontologii nadal działają, OBO wymusza system systemów wersjonowania , w którym każda wersja ontologii otrzymuje unikalny identyfikator, w postaci daty lub numeracji system i metadane dags.

Zakres

Ontologie powinny mieć jasno określony zakres (dziedzinę, którą zamierzają objąć).

Mieć definicje tekstowe

Ontologie powinny mieć definicje tekstowe dla każdego elementu, w sposób czytelny dla człowieka . Oznacza to, że oprócz identyfikacji alfanumerycznej dla każdego przedmiotu, powinny być one opisane w języku naturalnym afirmacjami logicznymi zgodnie z logiką Arystotelesa w sposób unikalny w obrębie ontologii.

Relacje standaryzowane i ontologia relacji (RO)

Ontologie powinny wykorzystywać relacje pomiędzy pozycjami z Ontologii Relacji (RO) . Zapewnia to bezproblemową integrację różnych ontologii, co jest szczególnie ważne dla logicznego wnioskowania .

The Relation Ontology (RO) to ontologia zaprojektowana do reprezentowania relacji między różnymi koncepcjami biomedycznymi. Opisuje rygorystycznie relacje, takie jak „part_of”, „located_in” i „preceded_by”, które są ponownie wykorzystywane przez wiele ontologii OBO Foundry.

Dokumentacja

Ontologie OBO muszą być dokładnie udokumentowane. Często odbywa się to za pośrednictwem repozytoriów GitHub dla każdej określonej ontologii (zobacz Lista ontologii OBO Foundry ).

Wielu użytkowników

Ontologie powinny być przydatne dla wielu różnych osób, a twórcy ontologii powinni dokumentować dowody użycia. To kryterium jest ważne dla procesu przeglądu. Przykłady użycia obejmują łącza do terminów przez inne ontologie, użycie w projektach sieci semantycznej , użycie w adnotacjach lub innych zastosowaniach badawczych.

Otwartość na współpracę

Ontologie powinny być rozwijane w sposób umożliwiający współpracę z innymi członkami OBO Foundry.

Miejsce władzy

Ontologie powinny mieć jedną osobę odpowiedzialną za ontologię, która pośredniczy w interakcji ze społecznością.

Konwencje nazewnictwa

Konwencje nazewnictwa ontologii OBO mają na celu uczynienie pierwotnych etykiet jednoznacznymi i unikalnymi w obrębie ontologii (a najlepiej wewnątrz OBO). Etykiety i synonimy powinny być napisane w języku angielskim, unikając podkreśleń i wielbłądów . OBO nie ma mechanizmu obsługi wielojęzycznej, w przeciwieństwie do Wikidata , który pozwala na etykiety w różnych systemach. System nazewnictwa w OBO opiera się na serii badań dotyczących katalogowania konwencji nazewnictwa aktualnych ontologii, a także odkrywania zagadnień związanych z tymi konwencjami.

Utrzymanie

Ontologie powinny być aktualizowane pod kątem zmian w konsensusie naukowym . Odlewnia OBO definiuje konsensus naukowy jako „wiele publikacji niezależnych laboratoriów w ciągu roku dochodzi do tego samego wniosku i nie ma żadnych lub jest ograniczona (<10%) odmiennych opinii opublikowanych w tym samym czasie”.

Zobacz też

Bibliografia

Zewnętrzne linki