Region zainteresowania - Region of interest

Obszar zainteresowania, dla którego nierówność Markowa daje dolną granicę.

Obszar zainteresowania (często w skrócie ROI ) to próbki w zbiorze danych zidentyfikowanych do określonego celu. Koncepcja ROI jest powszechnie stosowana w wielu obszarach zastosowań. Na przykład w obrazowaniu medycznym granice guza można określić na obrazie lub w objętości w celu pomiaru jego wielkości. Granica wsierdzia może być zdefiniowana na obrazie, być może podczas różnych faz cyklu pracy serca, na przykład końca skurczu i końca rozkurczu, w celu oceny funkcji serca. W systemach informacji geograficznej (GIS) ROI można traktować dosłownie jako wielokątny wybór z mapy 2D. W widzeniu komputerowym i optycznym rozpoznawaniu znaków ROI określa granice rozważanego obiektu. W wielu aplikacjach do obszaru ROI dodawane są symboliczne (tekstowe) etykiety, aby w zwięzły sposób opisywać jego zawartość. W obrębie ROI mogą znajdować się poszczególne punkty zainteresowania (POI).

Przykłady regionów zainteresowania

  • Zbiór danych 1D: przedział czasu lub częstotliwości na przebiegu on
  • Zbiór danych 2D: granice obiektu na obrazie
  • Zestaw danych 3D: kontury lub powierzchnie zarysowujące obiekt (czasami znane jako Objętość zainteresowania ( VOI )) w objętości
  • Zbiór danych 4D: zarys obiektu w określonym przedziale czasu lub w określonym przedziale czasu w objętości czasu

ROI to forma adnotacji , często powiązana z kategorycznymi lub ilościowymi informacjami (np. pomiarami, takimi jak objętość lub średnia intensywność), wyrażona jako tekst lub w formie strukturalnej.

Istnieją trzy zasadniczo różne sposoby kodowania ROI:

  • Jako integralna część przykładowego zbioru danych, z unikalną lub maskującą wartością, która może, ale nie musi, wykraczać poza normalny zakres normalnie występujących wartości i która oznacza poszczególne komórki danych
  • Jako oddzielne, czysto graficzne informacje, takie jak elementy rysunku wektorowego lub bitmapowego (rasteryzowanego), być może z towarzyszącym tekstem zwykłym (nieustrukturyzowanym) w formacie samych danych
  • Jako oddzielna ustrukturyzowana informacja semantyczna (taka jak kodowane typy wartości ) z zestawem współrzędnych przestrzennych i/lub czasowych

Obrazowanie medyczne

Zdjęcie po lewej przedstawia oryginalny obraz mammografii przed obróbką MED-SEG. Obraz po prawej stronie, z zaznaczonym obszarem zainteresowania (białym), przedstawia mammografię po przetworzeniu MED-SEG.

Standardy obrazowania medycznego, takie jak DICOM, zapewniają ogólne i specyficzne dla aplikacji mechanizmy wspierające różne przypadki użycia.

Dla obrazów DICOM (dwa lub więcej wymiarów):

  • Wypalone grafiki i tekst mogą występować w normalnym zakresie wartości pikseli (np. jako maksymalna wartość bieli) (przestarzałe)
  • Bitmapa (rasteryzowana) nakładka grafiki i tekstu może być obecna w nieużywanych wysokich bitach danych pikseli lub w oddzielnym atrybucie (przestarzałe)
  • Grafika wektorowa może być zakodowana w oddzielnych atrybutach obrazu jako krzywe (przestarzałe)
  • Nieustrukturyzowaną grafikę wektorową i tekst, a także nakładkę bitmapową (rasteryzowaną) można zakodować w oddzielnym obiekcie jako stan prezentacji, który odwołuje się do obiektu obrazu, do którego ma zostać zastosowany
  • Dane strukturalne mogą być zakodowane w oddzielnym obiekcie jako raport strukturalny w postaci drzewa par nazwa-wartość zakodowanych lub tekstowych pojęć, które mogą być powiązane z uzyskaną informacją ilościową, mogą odnosić się do współrzędnych przestrzennych i/lub czasowych, które z kolei odwołują się do obiektów obrazu do których się odnoszą
  • Lokalizacje referencyjne mogą być zakodowane jako fiducials w postaci współrzędnych przestrzennych z powiązanym kodowanym celem, jako współrzędne pikseli w odniesieniu do określonych obrazów lub jako współrzędne w nazwanej przestrzeni kartezjańskiej 3D względem pacjenta
  • Piksele (prawdopodobnie nieciągłe) mogą być klasyfikowane na segmenty zakodowane w obiekcie segmentacji jako wartości binarne lub probabilistyczne w rastrze (co nie jest wymagane, aby mieć takie samo próbkowanie przestrzenne lub zasięg jak obrazy, z których uzyskano segmentację); do nich zazwyczaj odwołują się inne obiekty zawierające ustrukturyzowaną treść (raporty ustrukturyzowane)

W przypadku radioterapii DICOM:

  • Kontury obiektów mogą być zdefiniowane jako zestawy struktur, jako współrzędne pikseli w odniesieniu do określonych obrazów lub jako współrzędne w nazwanej przestrzeni kartezjańskiej 3D względem pacjenta (są one również używane w zastosowaniach innych niż RT)

Dla przebiegów opartych na czasie DICOM:

  • Wypalone wartości mogą występować z przebiegiem (przestarzałe)
  • Adnotacje mogą być zakodowane w osobnym atrybucie, mogą wybierać wiele punktów czasowych lub zakres punktów czasowych, według numeru próbki lub określonego czasu
  • Dane strukturalne mogą być zakodowane w oddzielnym obiekcie jako raport strukturalny w postaci drzewa par nazwa-wartość zakodowanych lub tekstowych pojęć, które mogą być powiązane z uzyskaną informacją ilościową mogą odnosić się do współrzędnych czasowych, które z kolei odwołują się do obiektów falowych, do których się odnoszą

HL7 Clinical Document Architecture zawiera również podzbiór mechanizmów podobnych do (i które mają być z nim kompatybilne) DICOM do odwoływania się do współrzędnych przestrzennych związanych z obrazem jako obserwacji; pozwala zdefiniować okrąg, elipsę, polilinię lub punkt jako całkowite współrzędne względem pikseli, odnoszące się do zewnętrznego obiektu obrazu multimedialnego, który może być w formacie konsumenckim, a nie medycznym (np. GIF , PNG lub JPEG ) .

Systemy analizy dokumentów

W optycznym rozpoznawaniu znaków (OCR) i analizie układu dokumentu obszary zainteresowania (ROI) hierarchicznie obejmują strony, tekst lub bloki graficzne, aż do pojedynczych obrazów pasków linii, pól słów i obrazów znaków. De facto standardem w archiwach i bibliotekach jest tuplet {plik_obrazu, plik_xml}, zwykle w postaci pliku *.tif i towarzyszącego mu pliku *.xml.

Inne aplikacje 2D

Jeśli chodzi o standardy niemedyczne, oprócz czysto graficznych języków znaczników (takich jak PostScript czy PDF ) oraz grafiki wektorowej (takich jak SVG ) i 3D (takich jak VRML ) formaty plików rysunkowych są powszechnie dostępne i które nie mają określonej semantyki ROI, niektóre standardy, takie jak JPEG 2000, zapewniają mechanizmy etykietowania i/lub kompresji do różnych stopni wierności, co określają jako obszary zainteresowania.

Bibliografia