SAP HANA - SAP HANA

SAP HANA
Logo SAP SE
Deweloper(zy) SAP SE
Pierwsze wydanie 2010 ( 2010 )
Wersja stabilna 2.0 SPS05 (26 czerwca 2020 ; 12 miesięcy temu ) [±] ( 2020-06-26 )
Napisane w C , C++
System operacyjny Linux
Dostępne w język angielski
Rodzaj Wielomodelowa baza danych
Licencja Zastrzeżone oprogramowanie komercyjne
Stronie internetowej www .sap .com / produkty / Hana .html

SAP HANA (wysokowydajne urządzenie analityczne) to in-memory , zorientowany kolumnowo , system zarządzania relacyjnymi bazami danych opracowany i sprzedawany przez SAP SE . Jego podstawową funkcją jako oprogramowania uruchamiającego serwer bazy danych jest przechowywanie i pobieranie danych zgodnie z żądaniem aplikacji. Ponadto wykonuje zaawansowaną analitykę (analiza predykcyjna , przetwarzanie danych przestrzennych , analityka tekstu, wyszukiwanie tekstu, analityka strumieniowa , przetwarzanie danych wykresów ) i obejmuje funkcje wyodrębniania, przekształcania, ładowania (ETL) oraz serwer aplikacji .

Historia

Podczas wczesnego rozwoju SAP HANA firma SAP SE opracowała lub przejęła szereg technologii . Obejmowały one wyszukiwarkę TREX ( wyszukiwarkę zorientowaną na kolumny w pamięci ), P*TIME ( platformę przetwarzania transakcji online w pamięci (OLTP) przejętą przez SAP w 2005 r.) oraz MaxDB z silnikiem LiveCache w pamięci.

Pierwsza duża demonstracja platformy miała miejsce w 2008 roku: zespoły z SAP SE , Hasso Plattner Institute i Stanford University zademonstrowały architekturę aplikacji do analizy i agregacji w czasie rzeczywistym o nazwie HYRISE. Były dyrektor SAP SE, Vishal Sikka , nazwał tę architekturę „Nową Architekturą Hasso”. Zanim nazwa „HANA” ustabilizowała się, ludzie nazywali ten produkt „Nową Bazą Danych”. Oprogramowanie nosiło wcześniej nazwę „SAP High-Performance Analytic Appliance”.

Pierwsza praca naukowa na temat HYRISE została opublikowana w listopadzie 2010 r. Silnik badawczy został później udostępniony jako open source w 2013 r. i został przeprojektowany w 2016 r., by w 2017 r. stać się HYRISE2.

Pierwszy produkt został dostarczony pod koniec listopada 2010 r. W połowie 2011 r. technologia wzbudziła zainteresowanie, ale bardziej doświadczeni klienci biznesowi uważali ją za „początkową”. Wsparcie HANA dla SAP NetWeaver Business Warehouse zostało ogłoszone we wrześniu 2011 r. i będzie dostępne do listopada.

W 2012 roku SAP promował aspekty przetwarzania w chmurze . W październiku 2012 r. firma SAP ogłosiła platformę jako ofertę usługową o nazwie SAP HANA Cloud Platform oraz wariant o nazwie SAP HANA One, który wykorzystywał mniejszą ilość pamięci.

W maju 2013 roku ogłoszono ofertę zarządzanej chmury prywatnej o nazwie HANA Enterprise Cloud.

W maju 2013 r. udostępniono Business Suite na platformie HANA , umożliwiając klientom uruchamianie funkcji SAP Enterprise Resource Planning na platformie HANA.

S/4HANA , wydana w 2015 roku, napisana specjalnie dla platformy HANA, łączy funkcjonalność ERP , CRM , SRM i innych w jeden system HANA. S/4HANA ma być uproszczonym pakietem biznesowym, zastępującym systemy ERP wcześniejszej generacji . Chociaż prawdopodobne jest, że SAP skoncentruje swoje innowacje na S/4HANA, niektórzy klienci korzystający z systemów innych niż HANA zgłosili obawy związane z przywiązaniem do produktów SAP. Ponieważ S/4HANA wymaga działania systemu SAP HANA, klienci korzystający z aplikacji pakietu biznesowego SAP na sprzęcie niecertyfikowanym przez SAP będą musieli przeprowadzić migrację do bazy danych HANA z certyfikatem SAP, jeśli wybiorą funkcje oferowane przez S/4HANA.

Zamiast wersjonowania oprogramowanie wykorzystuje do aktualizacji dodatki Service Pack , zwane Support Package Stacks (SPS). Stosy pakietów wsparcia są wydawane co 6 miesięcy.

W listopadzie 2016 r. firma SAP ogłosiła rozwiązanie SAP HANA 2, które oferuje ulepszenia w wielu obszarach, takich jak zarządzanie bazami danych i zarządzanie aplikacjami, oraz zawiera dwie nowe usługi w chmurze: analizę tekstu i analizę obserwacji Ziemi. Klienci HANA mogą uaktualnić do HANA 2 z SPS10 i nowszych. Klienci korzystający z SPS9 i niższych muszą najpierw uaktualnić do SPS12 przed uaktualnieniem do HANA 2 SPS01.

Architektura

Przegląd

Główne różnice między HANA i poprzednich generacji systemów SAP to, że jest to kolumna zorientowanych , baza danych w pamięci , który łączy OLAP i OLTP operacje w jednym systemie; zatem ogólnie SAP HANA jest systemem OLTAP. Przechowywanie danych w pamięci głównej, a nie na dysku, zapewnia szybszy dostęp do danych, a co za tym idzie, szybsze zapytania i przetwarzanie. Chociaż przechowywanie danych w pamięci zapewnia korzyści w zakresie wydajności, jest to bardziej kosztowna forma przechowywania danych. Obserwując wzorce dostępu do danych, do 85% danych w systemie przedsiębiorstwa może być uzyskiwanych rzadko, dlatego opłacalne może być przechowywanie często używanych lub „gorących” danych w pamięci, podczas gdy rzadziej używane „ciepłe” dane są przechowywane na dysku, podejście, które firma SAP nazwała „Dynamicznym warstwowaniem”.

Systemy zorientowane na kolumny przechowują wszystkie dane dla jednej kolumny w tej samej lokalizacji, zamiast przechowywać wszystkie dane dla jednego wiersza w tej samej lokalizacji (systemy zorientowane na wiersz). Może to umożliwić poprawę wydajności zapytań OLAP na dużych zestawach danych i umożliwia większą kompresję pionową podobnych typów danych w jednej kolumnie. Jeśli czasy odczytu danych przechowywanych w kolumnach są wystarczająco krótkie, skonsolidowane widoki danych można wykonywać na bieżąco , eliminując potrzebę utrzymywania widoków zagregowanych i związanej z nimi nadmiarowości danych .

Chociaż systemy zorientowane na wiersz były tradycyjnie preferowane w przypadku OLTP , pamięć masowa w pamięci otwiera techniki umożliwiające opracowywanie systemów hybrydowych odpowiednich zarówno dla funkcji OLAP, jak i OLTP , eliminując potrzebę utrzymywania oddzielnych systemów dla operacji OLTP i OLAP.

Składniki indeksatora

Serwer indeksu wykonuje zarządzanie sesjami, autoryzację, zarządzanie transakcjami i przetwarzanie poleceń. Baza danych zawiera zarówno magazyn wierszowy, jak i magazyn kolumnowy. Użytkownicy mogą tworzyć tabele przy użyciu dowolnego magazynu, ale magazyn kolumnowy ma więcej możliwości i jest najczęściej używany. Serwer indeksu zarządza również trwałością między obrazami obiektów bazy danych w pamięci podręcznej, plikami dziennika i plikami pamięci trwałej. Silnik XS umożliwia budowanie aplikacji internetowych.

Modelowanie informacji SAP HANA (znane również jako modelowanie danych SAP HANA) jest częścią rozwoju aplikacji HANA. Modelowanie to metodologia udostępniania danych operacyjnych użytkownikowi końcowemu. W procesie modelowania wykorzystywane są obiekty wirtualne wielokrotnego użytku (nazwane widoki obliczeniowe).

MVCC

SAP HANA zarządza współbieżnością za pomocą wielowersyjnej kontroli współbieżności (MVCC), która zapewnia każdej transakcji migawkę bazy danych w określonym momencie. Gdy baza danych MVCC musi zaktualizować element danych, nie zastąpi starych danych nowymi danymi, ale zamiast tego oznaczy stare dane jako przestarzałe i doda nowszą wersję.

Wielkie dane

W środowisku skalowalnym w poziomie platforma HANA może przechowywać w pamięci woluminy do petabajta danych, zwracając wyniki zapytania w czasie poniżej sekundy. Jednak pamięć RAM jest nadal znacznie droższa niż miejsce na dysku, więc podejście skalowania w poziomie jest możliwe tylko w niektórych przypadkach krytycznych czasowo.

Analityka

SAP HANA zawiera szereg silników analitycznych do różnego rodzaju przetwarzania danych. Biblioteka funkcji biznesowych zawiera szereg algorytmów udostępnionych do obsługi typowych algorytmów przetwarzania danych biznesowych, takich jak amortyzacja aktywów , prognoza krocząca i średnia ruchoma . Biblioteka analiz predykcyjnych zawiera natywne algorytmy do obliczania typowych miar statystycznych w obszarach takich jak grupowanie , klasyfikacja i analiza szeregów czasowych .

HANA zawiera język R o otwartym kodzie źródłowym jako język obsługiwany w procedurach składowanych .

Baza danych magazynu kolumn oferuje możliwości bazy danych wykresów . Silnik wykresów przetwarza język zapytań Cypher, a także umożliwia wizualną manipulację wykresem za pomocą narzędzia o nazwie Graph Viewer. Struktury danych wykresów są przechowywane bezpośrednio w tabelach relacyjnych w magazynie kolumn HANA. Wbudowane algorytmy w silniku grafowym obejmują dopasowywanie wzorców, wyszukiwanie sąsiedztwa, pojedynczą najkrótszą ścieżkę i silnie połączone komponenty. Typowe sytuacje użycia Graph Engine obejmują przykłady, takie jak śledzenie łańcucha dostaw, wykrywanie oszustw oraz planowanie logistyki i tras.

HANA zawiera również przestrzenny silnik bazy danych , który implementuje typy danych przestrzennych i rozszerzenia SQL dla operacji CRUD na danych przestrzennych. HANA posiada certyfikat Open Geospatial Consortium i integruje się z systemem informacji geograficznej ESRI ArcGIS .

Oprócz algorytmów numerycznych i statystycznych, HANA może wykonywać analizy tekstowe i korporacyjne wyszukiwanie tekstowe. Możliwości wyszukiwania platformy HANA opierają się na „rozmytym” wyszukiwaniu odpornym na błędy, podobnie jak nowoczesne wyszukiwarki internetowe. Wyniki zawierają miarę statystyczną określającą trafność wyników wyszukiwania, a kryteria wyszukiwania mogą zawierać próg dokładności wyników. Dostępne analizy obejmują identyfikację podmiotów, takich jak osoby, daty, miejsca, organizacje, prośby, problemy i inne. Taka ekstrakcja encji może być dostosowana do konkretnych przypadków użycia, takich jak Voice of the Customer (preferencje i oczekiwania klienta), Enterprise (tj. fuzje i przejęcia, produkty, organizacje) i Public Sector (osoby publiczne, wydarzenia, organizacje). Można również zaimplementować niestandardowe wyodrębnianie i słowniki.

Rozwój aplikacji

Poza funkcjami bazy danych i analizy danych, SAP HANA jest internetowym serwerem aplikacji , obsługującym aplikacje skierowane do użytkowników, ściśle zintegrowane z bazami danych i silnikami analitycznymi HANA. „XS Advanced Engine” (XSA) natywnie współpracuje z językami i środowiskami uruchomieniowymi Node.js i JavaEE . XSA opiera się na architekturze Cloud Foundry, a tym samym wspiera pojęcie „Bring Your Own Language”, umożliwiając programistom tworzenie i wdrażanie aplikacji napisanych w językach i środowiskach wykonawczych innych niż te, które XSA implementuje natywnie, a także wdrażanie aplikacji jako mikroserwisów . XSA pozwala również na JavaScript po stronie serwera (XSJS).

Wspomaganie serwera aplikacji to zestaw narzędzi do zarządzania cyklem życia aplikacji, który pozwala na rozwijanie wdrażania i monitorowanie aplikacji dostępnych dla użytkowników.

Rozlokowanie

HANA można wdrożyć lokalnie lub w chmurze od wielu dostawców usług w chmurze .

HANA można wdrożyć lokalnie jako nowe urządzenie od certyfikowanego dostawcy sprzętu. Alternatywnie, w ramach wdrożenia można wykorzystać istniejące komponenty sprzętowe, takie jak pamięć masowa i sieć, co SAP nazywa „dostosowaną integracją centrum danych (TDI)”. HANA jest certyfikowana do pracy w wielu systemach operacyjnych, w tym SUSE Linux Enterprise Server i Red Hat Enterprise Linux . Obsługiwane platformy sprzętowe do wdrażania lokalnego obejmują Intel 64 i POWER Systems . System został zaprojektowany do obsługi skalowania zarówno w poziomie, jak i w pionie .

Wielu dostawców chmury oferuje SAP HANA na zasadzie Infrastructure as a Service , w tym:

SAP oferuje również własne usługi chmurowe w postaci:

Edycje

Licencjonowanie SAP HANA dzieli się przede wszystkim na dwie kategorie.

Licencja uruchomieniowa:

Służy do uruchamiania aplikacji SAP, takich jak SAP Business Warehouse obsługiwanych przez SAP HANA i SAP S/4HANA .

Licencja na pełne użytkowanie:

Służy do uruchamiania aplikacji SAP i innych niż SAP. Tej licencji można używać do tworzenia niestandardowych aplikacji.

W ramach licencji pełnego użytkowania funkcje są pogrupowane jako edycje przeznaczone do różnych przypadków użycia.

  • Wersja podstawowa: Zawiera podstawowe funkcje bazy danych i narzędzia programistyczne, ale nie obsługuje aplikacji SAP.
  • Wersja platformy: Wersja podstawowa oraz przestrzenna, predykcyjna, integracja z serwerem R, wyszukiwanie, tekst, analityka, silniki wykresów i dodatkowe pakiety bibliotek biznesowych.
  • Enterprise Edition: Edycja platformy oraz dodatkowe składniki w pakiecie dla niektórych funkcji ładowania danych i struktury reguł.

Ponadto możliwości, takie jak przesyłanie strumieniowe i ETL, są licencjonowane jako opcje dodatkowe.

Od 9 marca 2017 r. SAP HANA jest dostępny w wersji Express ; uproszczona wersja, która może działać na laptopach i innych środowiskach o ograniczonych zasobach. Licencja na SAP HANA, express edition jest bezpłatna, nawet przy produktywnym użytkowaniu do 32 GB pamięci RAM. Można kupić dodatkowe zwiększenie pojemności.

Zobacz też

Bibliografia

Linki zewnętrzne