Zautomatyzowane uczenie maszynowe - Automated machine learning
Część serii na |
Uczenie maszynowe i eksploracja danych |
---|
Zautomatyzowane uczenie maszynowe ( AutoML ) to proces automatyzacji zadań związanych z zastosowaniem uczenia maszynowego do rzeczywistych problemów. AutoML obejmuje cały potok od nieprzetworzonego zestawu danych do wdrażalnego modelu uczenia maszynowego. AutoML został zaproponowany jako rozwiązanie oparte na sztucznej inteligencji , aby sprostać stale rosnącemu wyzwaniu stosowania uczenia maszynowego. Wysoki stopień automatyzacji w AutoML umożliwia osobom niebędącym ekspertami korzystanie z modeli i technik uczenia maszynowego bez konieczności stania się ekspertem w uczeniu maszynowym. Zautomatyzowanie procesu stosowania uczenia maszynowego end-to-end dodatkowo oferuje korzyści w postaci tworzenia prostszych rozwiązań, szybszego tworzenia tych rozwiązań i modeli, które często przewyższają modele ręcznie zaprojektowane. AutoML został użyty do porównania względnej ważności każdego czynnika w modelu predykcyjnym.
Porównanie do podejścia standardowego
W typowej aplikacji uczenia maszynowego praktycy mają zestaw wejściowych punktów danych, których można użyć do szkolenia. Surowe dane mogą nie mieć takiej postaci, w której można by do nich zastosować wszystkie algorytmy. Aby dane podatne na uczenie maszynowe, ekspert może mieć zastosowanie odpowiednie dane wstępne przetwarzanie , inżynierię fabularny , wydobywania cech i wyboru cechą metod. Po tych krokach praktycy muszą następnie dokonać wyboru algorytmu i optymalizacji hiperparametrów, aby zmaksymalizować wydajność predykcyjną swojego modelu. Każdy z tych kroków może być trudny, co powoduje znaczne utrudnienia w korzystaniu z uczenia maszynowego.
AutoML znacznie upraszcza te kroki dla osób niebędących ekspertami.
Cele automatyzacji
Zautomatyzowane uczenie maszynowe może być ukierunkowane na różne etapy procesu uczenia maszynowego. Kroki do automatyzacji to:
-
Przygotowanie i przetwarzanie danych (z danych surowych i różnych formatów)
- Wykrywanie typu kolumny ; np. boolowski, dyskretny numeryczny, ciągły numeryczny lub tekst
- Wykrywanie zamiaru kolumny; np. cel/etykieta, pole stratyfikacji , cecha liczbowa, cecha tekstu kategorialnego lub cecha dowolnego tekstu
- Wykrywanie zadań; np. klasyfikacja binarna , regresja , grupowanie lub ranking
-
Inżynieria funkcji
- Wybór funkcji
- Ekstrakcja funkcji
- Meta learning i transfer learning
- Wykrywanie i obsługa wypaczonych danych i/lub brakujących wartości
- Wybór modelu
- Optymalizacja hiperparametrów algorytmu uczenia i cechowania
- Wybór potoków przy ograniczeniach czasu, pamięci i złożoności
- Wybór mierników oceny i procedur walidacji
- Sprawdzanie problemu
- Wykrywanie wycieków
- Wykrywanie błędnej konfiguracji
- Analiza uzyskanych wyników
- Tworzenie interfejsów użytkownika i wizualizacji
Zobacz też
- Wyszukiwanie architektury neuronowej
- Neuroewolucja
- Samodostrajanie
- Inteligencja sieci neuronowych
- AutoAI
- ModelOps
Bibliografia
Dalsza lektura
- „Narzędzia Open Source AutoML: AutoGluon, TransmogrifAI, Auto-sklearn i NNI” . Bizety . 2020-06-16.