Kreatywność obliczeniowa - Computational creativity

Kreatywność obliczeniowa (znana również jako sztuczna kreatywność , kreatywność mechaniczna , kreatywne przetwarzanie lub kreatywne obliczanie ) to multidyscyplinarne przedsięwzięcie, które znajduje się na przecięciu dziedzin sztucznej inteligencji , psychologii poznawczej , filozofii i sztuki .

Celem kreatywności obliczeniowej jest modelowanie, symulowanie lub replikowanie kreatywności za pomocą komputera, aby osiągnąć jeden z kilku celów:

  • Skonstruować program lub komputer zdolny do kreatywności na poziomie człowieka .
  • Lepsze zrozumienie ludzkiej kreatywności i sformułowanie algorytmicznej perspektywy twórczych zachowań ludzi.
  • Projektować programy, które mogą zwiększyć ludzką kreatywność, niekoniecznie będąc kreatywnymi.

Dziedzina kreatywności obliczeniowej zajmuje się zagadnieniami teoretycznymi i praktycznymi w badaniu kreatywności. Praca teoretyczna nad naturą i właściwym zdefiniowaniem kreatywności odbywa się równolegle z pracą praktyczną nad wdrażaniem systemów wykazujących kreatywność, przy czym jeden wątek pracy wpływa na drugi.

Zastosowana forma kreatywności obliczeniowej nazywana jest syntezą mediów .

Zagadnienia teoretyczne

Jeśli wybitna kreatywność polega na łamaniu zasad lub obalaniu konwencji, jak to możliwe, że system algorytmiczny może być kreatywny? W istocie jest to wariant sprzeciwu Ady Lovelace wobec inteligencji maszynowej, jak rekapitulowali współcześni teoretycy, tacy jak Teresa Amabile. Jeśli maszyna może robić tylko to, do czego została zaprogramowana, jak jej zachowanie można kiedykolwiek nazwać kreatywnym ?

Rzeczywiście, nie wszyscy teoretycy komputerowi zgodziliby się z założeniem, że komputery mogą robić tylko to, do czego są zaprogramowane – kluczowy punkt przemawiający za kreatywnością obliczeniową.

Definiowanie kreatywności w kategoriach obliczeniowych

Ponieważ żadna pojedyncza perspektywa ani definicja nie wydaje się oferować pełnego obrazu kreatywności, badacze sztucznej inteligencji Newell, Shaw i Simon opracowali połączenie nowości i użyteczności w kamień węgielny wieloaspektowego spojrzenia na kreatywność, które wykorzystuje następujące cztery kryteria do kategoryzować daną odpowiedź lub rozwiązanie jako kreatywne:

  1. Odpowiedź jest nowatorska i użyteczna (zarówno dla jednostki, jak i dla społeczeństwa)
  2. Odpowiedź wymaga odrzucenia pomysłów, które wcześniej zaakceptowaliśmy
  3. Odpowiedź wynika z intensywnej motywacji i wytrwałości
  4. Odpowiedź pochodzi z wyjaśnienia problemu, który początkowo był niejasny

Podczas gdy powyższe odzwierciedla podejście „odgórne” do kreatywności obliczeniowej, alternatywny wątek rozwinął się wśród „oddolnych” psychologów obliczeniowych zaangażowanych w badania nad sztucznymi sieciami neuronowymi. Na przykład pod koniec lat 80. i na początku lat 90. takie generatywne systemy neuronowe były napędzane algorytmami genetycznymi . Eksperymenty z powtarzającymi się sieciami zakończyły się sukcesem w hybrydyzacji prostych melodii muzycznych i przewidywaniu oczekiwań słuchaczy.

W swojej książce Superhuman Creators Al Byrd twierdzi, że głównym źródłem kreatywności u ludzi i innych zwierząt jest świadomość afordancji – świadomość możliwości działania w środowisku. Nadludzką kreatywność można osiągnąć poprzez radykalne zwiększenie świadomości afordancji sztucznych bytów i ścisłe zintegrowanie tej świadomości z systemami zdolnymi do wykorzystania możliwości działania.

Sztuczne sieci neuronowe

Przed 1989 r. sztuczne sieci neuronowe były wykorzystywane do modelowania pewnych aspektów kreatywności. Peter Todd (1989) jako pierwszy wytrenował sieć neuronową do odtwarzania melodii muzycznych z zestawu ćwiczeniowego utworów muzycznych. Następnie użył algorytmu zmiany do modyfikacji parametrów wejściowych sieci. Sieć była w stanie losowo generować nową muzykę w wysoce niekontrolowany sposób. W 1992 roku Todd rozszerzył tę pracę, stosując tak zwane podejście nauczyciela dystalnego, które zostało opracowane przez Paula Munro, Paula Werbosa , D. Nguyena i Bernarda Widrow , Michaela I. Jordana i Davida Rumelharta . W nowym podejściu istnieją dwie sieci neuronowe, z których jedna dostarcza wzorce treningowe drugiej. W późniejszych wysiłkach Todda kompozytor wybierał zestaw melodii definiujących przestrzeń melodii, umieszczał je na płaszczyźnie dwuwymiarowej z interfejsem graficznym opartym na myszy i szkolił sieć koneksjonistyczną do wytwarzania tych melodii i słuchania nowe „interpolowane” melodie, które sieć generuje, odpowiadające punktom pośrednim na płaszczyźnie 2-wymiarowej.

Kluczowe pojęcia z literatury

Niektóre wątki wysokiego poziomu i filozoficzne powracają w całej dziedzinie kreatywności obliczeniowej.

Ważne kategorie kreatywności

Margaret Boden odnosi się do kreatywności, która jest nowa jedynie dla podmiotu, który ją wytwarza, jako „P-kreatywność” (lub „kreatywność psychologiczna”) i odnosi się do kreatywności, która jest uznawana za nowość przez społeczeństwo jako „H-kreatywność” (lub „twórczość historyczna”). Stephen Thaler zasugerował nową kategorię, którą nazywa „V-” lub „kreatywnością trzewną”, w której znaczenie jest wynajdywane poprzez mapowanie neuronowe na surowe dane sensoryczne w architekturze maszyny kreatywności, z sieciami „bramek” zaburzonymi w celu tworzenia alternatywnych interpretacji i sieciami w dolnym biegu przesunięcie takich interpretacji, aby pasowały do ​​nadrzędnego kontekstu. Ważną odmianą takiej V-kreatywności jest sama świadomość, w której odruchowo wymyśla się znaczenie obrotu aktywacyjnego w mózgu. Kreatywność oparta na wartościach daje systemowi AI większą swobodę i autonomię.

Kreatywność odkrywcza i transformacyjna

Boden rozróżnia także kreatywność, która powstaje z eksploracji w ramach ustalonej przestrzeni konceptualnej, oraz kreatywność, która wynika z celowej transformacji lub transcendencji tej przestrzeni. Tę pierwszą określa jako kreatywność odkrywczą, a drugą jako kreatywność transformacyjną , postrzegając tę ​​drugą jako formę twórczości o wiele bardziej radykalną, wymagającą i rzadszą niż ta pierwsza. Stosując się do kryteriów Newella i Simona, które zostały omówione powyżej, możemy zauważyć, że obie formy kreatywności powinny dawać wyniki, które są w znacznym stopniu nowatorskie i użyteczne (kryterium 1), ale kreatywność eksploracyjna jest bardziej prawdopodobna, gdy jest wynikiem dokładnego i wytrwałego poszukiwania rozumiana przestrzeń (kryterium 3) – natomiast twórczość transformacyjna powinna polegać na odrzuceniu niektórych ograniczeń definiujących tę przestrzeń (kryterium 2) lub niektórych założeń definiujących sam problem (kryterium 4). Spostrzeżenia Bodena kierowały pracą nad kreatywnością obliczeniową na bardzo ogólnym poziomie, stanowiąc bardziej inspirujący punkt odniesienia dla prac rozwojowych niż techniczne ramy substancji algorytmicznej. Jednak spostrzeżenia Bodena są ostatnio również przedmiotem formalizacji, zwłaszcza w pracy Gerainta Wigginsa.

Generowanie i ocena

Kryterium, że kreatywne produkty powinny być nowatorskie i użyteczne, oznacza, że ​​kreatywne systemy obliczeniowe są zazwyczaj podzielone na dwie fazy: wytwarzanie i ocenę. W pierwszej fazie generowane są nowe (dla samego systemu, a więc P-Creative) konstrukty; nieoryginalne konstrukty, które są już znane systemowi, są na tym etapie filtrowane. Ten zbiór potencjalnie kreatywnych konstruktów jest następnie oceniany w celu określenia, które są znaczące i użyteczne, a które nie. Ta dwufazowa struktura jest zgodna z modelem Geneplore Finke'a, Warda i Smitha, który jest psychologicznym modelem twórczego generowania opartym na empirycznej obserwacji ludzkiej twórczości.

Kreatywność kombinatoryczna

Wiele, być może całość ludzkiej kreatywności może być rozumiana jako nowe połączenie istniejących wcześniej idei lub przedmiotów. Typowe strategie kreatywności kombinatorycznej obejmują:

  • Umieszczenie znanego obiektu w nieznanym otoczeniu (na przykład, Marcel Duchamp jest Źródło ) lub obcy obiekt w znanym ustawieniu (np historia ryb poza wodzie, takie jak Beverly Hillbillies )
  • Mieszanie dwóch pozornie różnych przedmiotów lub gatunków (np. opowieść science fiction osadzona na Dzikim Zachodzie, z kowbojami-robotami, jak w Westworld , lub na odwrót, jak w Firefly ; japońskie wiersze haiku itp.)
  • Porównanie znajomego obiektu z pojęciem powierzchownie niepowiązanym i semantycznie odległym (np. „Makijaż to zachodnia burka ”; „ Zoo to galeria z żywymi eksponatami”)
  • Dodanie nowej i nieoczekiwanej funkcji do istniejącej koncepcji (np. dodanie skalpela do szwajcarskiego scyzoryka ; dodanie aparatu do telefonu komórkowego )
  • Kompresowanie dwóch niepasujących do siebie scenariuszy w tę samą narrację, aby uzyskać dowcip (np. żart Emo Philips „Kobiety zawsze wykorzystują mężczyzn do rozwoju kariery. Przeklęci antropolodzy!”)
  • Używanie kultowego obrazu z jednej domeny w domenie dla niepowiązanego lub niestosownego pomysłu lub produktu (np. używanie wizerunku Marlboro Man do sprzedaży samochodów lub reklamowania niebezpieczeństw związanych z impotencją związaną z paleniem).

Perspektywa kombinatoryczna pozwala modelować kreatywność jako proces poszukiwania w przestrzeni możliwych kombinacji. Kombinacje mogą wynikać z kompozycji lub konkatenacji różnych reprezentacji, lub poprzez oparte na regułach lub stochastyczne przekształcenie reprezentacji początkowych i pośrednich. Algorytmy genetyczne i sieci neuronowe mogą być używane do generowania reprezentacji mieszanych lub krzyżowych, które przechwytują kombinację różnych danych wejściowych.

Mieszanie koncepcyjne

Mark Turner i Gilles Fauconnier proponują model zwany Conceptual Integration Networks, który rozwija idee Arthura Koestlera na temat kreatywności, a także nowsze prace Lakoffa i Johnsona, poprzez syntezę pomysłów z badań Cognitive Linguistic nad przestrzeniami mentalnymi i metaforami pojęciowymi . Ich podstawowy model definiuje sieć integracyjną jako cztery połączone przestrzenie:

  • Pierwsza przestrzeń wejściowa (zawiera jedną strukturę pojęciową lub przestrzeń mentalną)
  • Druga przestrzeń wejściowa (do zmieszania z pierwszym wejściem)
  • Rodzajowy przestrzeń konwencji zapasów i schematy graficzne-przestrzenie, które umożliwiają wejście należy rozumieć z zintegrowanym perspektywie
  • Przestrzeń mieszankę , w której wybrany występ elementów z obu miejsc wejścia są połączone; wnioskowania wynikające z tej kombinacji również tu znajdują się, prowadząc czasami do wyłaniających się struktur, które są w konflikcie z danymi wejściowymi.

Fauconnier i Turner opisują zbiór zasad optymalności, które mają kierować budową dobrze uformowanej sieci integracyjnej. Zasadniczo postrzegają mieszanie jako mechanizm kompresji, w którym dwie lub więcej struktur wejściowych jest kompresowanych w jedną strukturę mieszania. Ta kompresja działa na poziomie relacji pojęciowych. Na przykład serię relacji podobieństwa między przestrzeniami wejściowymi można skompresować do pojedynczej relacji tożsamości w mieszance.

Pewien sukces obliczeniowy osiągnięto dzięki modelowi mieszania, rozszerzając istniejące wcześniej modele obliczeniowe mapowania analogowego, które są kompatybilne ze względu na ich nacisk na połączone struktury semantyczne. Niedawno Francisco Câmara Pereira przedstawił implementację teorii mieszania, która wykorzystuje pomysły zarówno GOFAI, jak i algorytmy genetyczne, aby zrealizować niektóre aspekty teorii mieszania w praktycznej formie; jego przykładowe domeny sięgają od lingwistyki po wizualną, a ta ostatnia w szczególności obejmuje tworzenie mitycznych potworów poprzez łączenie trójwymiarowych modeli graficznych.

kreatywność językowa

Język zapewnia ciągłą możliwość kreatywności, widoczne w generowaniu nowych zdań, phrasings, kalambury , neologizmów , rymy , aluzji , sarkazmu , ironii , porównań , metafor , analogii , dowcipów i żartów . Native speakerzy języków bogatych morfologicznie często tworzą nowe formy wyrazowe, które są łatwe do zrozumienia, a niektóre z nich trafiły do ​​słownika. Obszar generowania języka naturalnego został dobrze zbadany, ale te kreatywne aspekty języka potocznego nie zostały jeszcze uwzględnione z jakąkolwiek solidnością lub skalą.

Hipoteza wzorców twórczych

W przełomowej pracy lingwisty stosowanego Ronalda Cartera postawił hipotezę o dwóch głównych typach kreatywności obejmujących słowa i wzorce słowne: kreatywność reformowania wzorców i kreatywność tworzenia wzorców. Kreatywność kształtująca wzorce odnosi się do kreatywności poprzez łamanie reguł, reformowanie i przekształcanie wzorców językowych często poprzez indywidualne innowacje, podczas gdy kreatywność kształtująca wzorce odnosi się do kreatywności poprzez dostosowywanie się do reguł językowych, a nie ich łamanie, tworzenie zbieżności, symetrii i większej wzajemności między rozmówców poprzez ich interakcje w formie powtórzeń.

Pokolenie historii

Wiele prac w tej dziedzinie kreacji językowej prowadzono od lat 70. XX wieku, wraz z rozwojem systemu TALE-SPIN Jamesa Meehana. TALE-SPIN postrzegało historie jako narracyjne opisy wysiłku związanego z rozwiązywaniem problemów i tworzyło historie, ustalając najpierw cel dla bohaterów opowieści, aby można było śledzić i rejestrować ich poszukiwania rozwiązania. System MINSTREL reprezentuje złożone opracowanie tego podstawowego podejścia, rozróżniając szereg celów na poziomie postaci w historii od szeregu celów na poziomie autora historii. Systemy takie jak BRUTUS Bringsjorda rozwijają te idee dalej, tworząc historie o złożonych interpersonalnych tematach, takich jak zdrada. Niemniej jednak MINSTREL wyraźnie modeluje proces twórczy za pomocą zestawu Transform Recall Adapt Methods (TRAM), aby tworzyć nowe sceny ze starego. Model MEXICA Rafaela Péreza y Péreza i Mike'a Sharplesa jest wyraźniej zainteresowany procesem twórczym opowiadania historii i wdraża wersję poznawczego modelu zaangażowania i refleksji kreatywnego pisania.

Firma Narrative Science udostępnia komercyjnie generowane komputerowo wiadomości i raporty, w tym podsumowujące zespołowe wydarzenia sportowe na podstawie danych statystycznych z gry. Tworzy również raporty finansowe i analizy nieruchomości.

Metafora i porównanie

Przykład metafory: „Była małpą”.

Przykład porównania: „Czułem się jak koc z tygrysiego futra ”. Obliczeniowe badanie tych zjawisk skupiało się głównie na interpretacji jako procesie opartym na wiedzy. Obliczeniowcy, tacy jak Yorick Wilks , James Martin, Dan Fass, John Barnden i Mark Lee, opracowali oparte na wiedzy podejścia do przetwarzania metafor, na poziomie lingwistycznym lub logicznym. Tony Veale i Yanfen Hao opracowali system o nazwie Sardonicus, który pozyskuje obszerną bazę danych jawnych porównań z sieci; te porównania są następnie oznaczane jako prawdziwe (np. „twarde jak stal”) lub ironiczne (np. „włochate jak kula do kręgli ”, „przyjemne jak kanał korzeniowy ”); porównania dowolnego typu można pobrać na żądanie dla dowolnego przymiotnika. Używają tych porównań jako podstawy systemu generowania metafor on-line zwanego Arystotelesem, który może sugerować metafory leksykalne dla danego celu opisowego (np. aby opisać supermodelkę jako chudą, terminy źródłowe „ołówek”, „bicz”, „ whippet ", "lina", " kij-owad " i "wąż" są sugerowane).

Analogia

Proces rozumowania przez analogię był badany zarówno z perspektywy mapowania, jak i wyszukiwania, przy czym ta ostatnia jest kluczem do generowania nowych analogii. Dominująca szkoła badań, wysunięta przez Dedre Gentnera , postrzega analogię jako proces zachowania struktury; widok ten został zaimplementowany w silniku mapowania struktury lub SME, silniku pobierania MAC/FAC (wiele jest nazywanych, niewielu jest wybranych), ACME ( analogiczny silnik mapowania z ograniczeniami ) i ARCS ( analogiczny silnik z ograniczeniami wyszukiwania ). Inne podejścia oparte na mapowaniu obejmują Sapper, który sytuuje proces mapowania w modelu pamięci sieci semantycznej. Analogia jest bardzo aktywnym podobszarem twórczego obliczania i twórczego poznania; aktywne postacie w tym podobszarze to Douglas Hofstadter , Paul Thagard i Keith Holyoak . Na uwagę zasługuje również podejście do uczenia maszynowego Petera Turneya i Michaela Littmana w rozwiązywaniu problemów analogii w stylu SAT ; ich podejście osiąga wynik, który dobrze porównuje się ze średnimi wynikami uzyskanymi przez ludzi w tych testach.

Pokolenie żartów

Humor jest procesem szczególnie wymagającym wiedzy, a najbardziej udane dotychczas systemy generowania żartów skupiały się na generowaniu kalamburów, czego przykładem są prace Kim Binsted i Graeme Ritchie. Ta praca obejmuje system JAPE , który może generować szeroką gamę kalamburów, które są konsekwentnie oceniane jako nowe i pełne humoru przez małe dzieci. Ulepszona wersja JAPE została opracowana pod postacią systemu STANDUP, który został eksperymentalnie wdrożony jako sposób na poprawę interakcji językowych z dziećmi z trudnościami w komunikacji. Poczyniono pewne ograniczone postępy w generowaniu humoru, który obejmuje inne aspekty języka naturalnego, takie jak celowe niezrozumienie odniesień zaimkowych (w pracy Hansa Wima Tinholta i Antona Nijholta), a także w generowaniu akronimów humorystycznych w akronimie HAHA system Oliviero Stock i Carlo Strapparava.

Neologizm

Mieszanie wielu form słownych jest dominującą siłą w tworzeniu nowych słów w języku; te nowe słowa są powszechnie nazywane „mieszankami” lub „ słowami portmanteau ” (od Lewisa Carrolla ). Tony Veale opracował system o nazwie ZeitGeist, który zbiera hasła neologiczne z Wikipedii i interpretuje je w odniesieniu do ich lokalnego kontekstu w Wikipedii oraz w odniesieniu do określonych sensów słów w WordNet . ZeitGeist został rozszerzony o generowanie własnych neologizmów; podejście to łączy elementy z inwentarza części słów zebranych z WordNet i jednocześnie określa prawdopodobne glosy dla tych nowych słów (np. „podróżnik kulinarny” dla „gastronauty” i „podróżnik w czasie” dla „ chrononauta ”). Następnie wykorzystuje wyszukiwanie w sieci, aby określić, które glosy są znaczące, a które neologizmy nie były wcześniej używane; to wyszukiwanie identyfikuje podzbiór wygenerowanych słów, które są zarówno nowatorskie („H-kreatywne”), jak i użyteczne.

Korpus językowy podejście do poszukiwania i wydobycia neologizm wykazały również możliwe. Używając Corpus of Contemporary American English jako korpusu referencyjnego, Locky Law dokonał ekstrakcji neologizmu , portmanteau i slangowych słów, używając hapax legomena, który pojawił się w scenariuszach amerykańskiego dramatu telewizyjnego House MD

W zakresie badań językoznawczych w neologizmie Stefan Th. Gries przeprowadził ilościową analizę struktury mieszanki w języku angielskim i stwierdził, że „stopień rozpoznawalności słów źródłowych i podobieństwo słów źródłowych do mieszanki odgrywa istotną rolę w tworzeniu mieszanki”. Wyniki zostały zweryfikowane poprzez porównanie celowych mieszanek z mieszankami błędów mowy.

Poezja

Bardziej niż żelazo, bardziej niż ołów, bardziej niż złoto potrzebuję elektryczności.
Potrzebuję go bardziej niż jagnięciny, wieprzowiny, sałaty czy ogórka.
Potrzebuję go do moich marzeń. Racer, z Broda policjanta jest w połowie skonstruowana

Podobnie jak żarty, wiersze obejmują złożoną interakcję różnych ograniczeń i żaden generator wierszy ogólnego przeznaczenia nie łączy w odpowiedni sposób znaczenia, frazowania, struktury i rymowania aspektów poezji. Niemniej jednak Pablo Gervás opracował godny uwagi system o nazwie ASPERA, który wykorzystuje podejście wnioskowania opartego na przypadkach (CBR) do generowania poetyckich sformułowań danego tekstu wejściowego za pomocą kompozycji fragmentów poetyckich, które są pobierane z bazy przypadków istniejących wierszy. Każdy fragment wiersza w bazie przypadku ASPERA jest opatrzony adnotacją prozą, która wyraża znaczenie fragmentu, a ten ciąg prozą jest używany jako klucz do wyszukiwania dla każdego fragmentu. Następnie stosuje się zasady metryczne, aby połączyć te fragmenty w dobrze ukształtowaną strukturę poetycką. Przykładem takiego projektu programowego jest firma Racer .

Kreatywność muzyczna

Kreatywność obliczeniowa w dziedzinie muzyki koncentrowała się zarówno na generowaniu partytur muzycznych do użytku przez muzyków, jak i na generowaniu muzyki do wykonania przez komputery. Domeną generacji była muzyka klasyczna (z oprogramowaniem generującym muzykę w stylu Mozarta i Bacha ) oraz jazz . Przede wszystkim David Cope napisał system oprogramowania o nazwie „Experiments in Musical Intelligence” (lub „EMI”), który jest w stanie analizować i uogólniać istniejącą muzykę kompozytora w celu wygenerowania nowatorskich kompozycji muzycznych w tym samym stylu. Dorobek EMI jest wystarczająco przekonujący, aby przekonać ludzkich słuchaczy, że jego muzyka jest generowana przez człowieka na wysokim poziomie kompetencji.

W dziedzinie współczesnej muzyki klasycznej Iamus jest pierwszym komputerem, który komponuje od podstaw i tworzy końcowe partytury, które mogą grać profesjonalni tłumacze. London Symphony Orchestra grał utwór na orkiestrę, zawarte w Iamus' debiutancką płytę , która New Scientist opisany jako «pierwszy poważny utwór skomponowany przez komputer i wykonywanej przez orkiestrę». Melomics , technologia stojąca za Iamusem, jest w stanie generować utwory w różnych stylach muzycznych o podobnym poziomie jakości.

Badania nad kreatywnością w jazzie koncentrowały się na procesie improwizacji i wymogach poznawczych, jakie nakłada to na czynnik muzyczny: rozumowanie o czasie, pamiętanie i konceptualizowanie tego, co już zostało zagrane, oraz planowanie z wyprzedzeniem tego, co może być zagrane dalej. Robot Shimon, opracowany przez Gila Weinberga z Georgia Tech, zademonstrował improwizację jazzową. Oprogramowanie do wirtualnej improwizacji, oparte na badaniach modelowania stylistycznego prowadzonego przez Gerarda Assayaga i Shlomo Dubnova, w tym OMax, SoMax i PyOracle, służy do tworzenia improwizacji w czasie rzeczywistym poprzez ponowne wstrzykiwanie sekwencji o zmiennej długości, których nauczył się na żywo od wykonawcy.

W 1994 roku architektura Creativity Machine (patrz wyżej) była w stanie wygenerować 11 000 muzycznych haczyków, szkoląc sieć neuronową z zaburzeniami synaptycznymi na 100 melodiach, które pojawiły się na liście dziesięciu najlepszych w ciągu ostatnich 30 lat. W 1996 roku samozaładowująca się maszyna kreatywności obserwowała mimikę publiczności za pomocą zaawansowanego systemu widzenia maszynowego i udoskonaliła swoje muzyczne talenty, aby stworzyć album zatytułowany „Song of the Neurons”

W dziedzinie kompozycji muzycznej opatentowane dzieła René-Louisa Barona pozwoliły stworzyć robota, który może tworzyć i odtwarzać wiele orkiestrowanych melodii, tzw. „spójnych” w dowolnym stylu muzycznym. Wszystkie parametry fizyczne na zewnątrz związane z jednym lub kilkoma konkretnymi parametrami muzycznymi mogą wpływać i rozwijać każdą z tych piosenek (w czasie rzeczywistym podczas słuchania utworu). Opatentowany wynalazek Medal-Composer rodzi problemy z prawami autorskimi.

Kreatywność wizualna i artystyczna

Twórczość obliczeniowa w pokoleniu sztuk wizualnych odniosła kilka znaczących sukcesów w tworzeniu zarówno sztuki abstrakcyjnej, jak i sztuki reprezentacyjnej. Najbardziej znanym programem w tej dziedzinie jest Harold Cohen „s AARON , który stale rozwijane i zwiększone od 1973 chociaż stereotypowy Aaron wykazuje szereg wyjść, tworząc czarne-białe lub kolorowe obrazy rysunków, które zawierają dane człowieka (np jako tancerze), rośliny doniczkowe, skały i inne elementy obrazów tła. Obrazy te są wystarczająco wysokiej jakości, aby można je było wyświetlać w renomowanych galeriach.

Inni twórcy oprogramowania, na których warto zwrócić uwagę, to system NEvAr (dla „ Sztuki neuro -ewolucyjnej ”) Penousal Machado. NEvAr wykorzystuje algorytm genetyczny do wyprowadzenia funkcji matematycznej, która jest następnie wykorzystywana do generowania kolorowej trójwymiarowej powierzchni. Użytkownik może wybrać najlepsze zdjęcia po każdej fazie algorytmu genetycznego, a preferencje te są wykorzystywane do kierowania kolejnymi fazami, tym samym popychając wyszukiwanie NEvAr do obszarów przestrzeni wyszukiwania, które są uważane za najbardziej atrakcyjne dla użytkownika.

The Painting Fool , opracowany przez Simona Coltona, powstał jako system do zamalowywania cyfrowych obrazów danej sceny w różnych stylach malowania, paletach kolorów i rodzajach pędzli. Biorąc pod uwagę jego zależność od wejściowego obrazu źródłowego do pracy, najwcześniejsze iteracje Malarskiego Głupca rodziły pytania o zakres lub brak kreatywności w systemie sztuki obliczeniowej. Niemniej jednak, w nowszych pracach The Painting Fool został rozszerzony o tworzenie nowatorskich obrazów, podobnie jak robi to AARON , z własnej ograniczonej wyobraźni. Obrazy w tym duchu obejmują pejzaże miejskie i lasy, które są generowane przez proces spełniania ograniczeń z niektórych podstawowych scenariuszy dostarczonych przez użytkownika (np. scenariusze te pozwalają systemowi wywnioskować, że obiekty bliżej płaszczyzny oglądania powinny być większe i bardziej kolorowe). nasycone, podczas gdy te znajdujące się dalej powinny być mniej nasycone i wydawać się mniejsze). Pod względem artystycznym obrazy tworzone teraz przez Malarskiego Głupca są na równi z tymi stworzonymi przez Aarona, choć rozszerzalne mechanizmy zastosowane przez tego pierwszego (ograniczona satysfakcja itp.) mogą z powodzeniem pozwolić mu rozwinąć się w bardziej wyrafinowanego i wyrafinowanego malarza.

Artysta Krasi Dimtch (Krasimira Dimtchevska) i programista Svillen Ranev stworzyli system obliczeniowy łączący oparty na regułach generator angielskich zdań i wizualny kreator kompozycji, który przekształca zdania generowane przez system w abstrakcyjną sztukę. Oprogramowanie automatycznie generuje nieskończoną liczbę różnych obrazów przy użyciu różnych palet kolorów, kształtów i rozmiarów. Oprogramowanie pozwala również użytkownikowi wybrać temat generowanych zdań lub/i jedną lub więcej palet używanych przez konstruktora kompozycji wizualnej.

Wyłaniającym się obszarem kreatywności obliczeniowej są gry wideo. ANGELINA to system do kreatywnego tworzenia gier wideo w języku Java autorstwa Michaela Cooka. Ważnym aspektem jest Mechanic Miner, system, który może generować krótkie fragmenty kodu, które działają jak prosta mechanika gry. ANGELINA może ocenić tę mechanikę pod kątem użyteczności, grając w proste nierozwiązywalne poziomy gry i testując, czy nowa mechanika sprawia, że ​​poziom jest możliwy do rozwiązania. Czasami Mechanic Miner odkrywa błędy w kodzie i wykorzystuje je, aby stworzyć nową mechanikę, z którą gracz może rozwiązywać problemy.

W lipcu 2015 r. Google wypuściło DeepDream – program do widzenia komputerowego o otwartym kodzie źródłowym , stworzony do wykrywania twarzy i innych wzorów na obrazach w celu automatycznej klasyfikacji obrazów, który wykorzystuje splotową sieć neuronową do znajdowania i poprawiania wzorów na obrazach za pomocą pareidoliów algorytmicznych , tworząc w ten sposób senny, psychodeliczny wygląd w celowo przetworzonych obrazach.

W sierpniu 2015 r. badacze z Tybingi w Niemczech stworzyli splotową sieć neuronową, która wykorzystuje reprezentacje neuronowe do oddzielania i ponownego łączenia treści i stylu dowolnych obrazów, która jest w stanie przekształcić obrazy w stylistyczne imitacje dzieł sztuki takich artystów jak Picasso czy Van Gogh w około godziny. Ich algorytm jest wykorzystywany w serwisie DeepArt, który umożliwia użytkownikom tworzenie unikalnych obrazów artystycznych za pomocą ich algorytmu.

Na początku 2016 roku globalny zespół naukowców wyjaśnił, w jaki sposób nowe podejście do kreatywności obliczeniowej, znane jako Digital Synaptic Neural Substrate (DSNS), może zostać wykorzystane do generowania oryginalnych łamigłówek szachowych, które nie pochodzą z baz danych końcowych. DSNS jest w stanie łączyć cechy różnych obiektów (np. problemy szachowe, obrazy, muzykę) przy użyciu metod stochastycznych w celu uzyskania nowych specyfikacji cech, które można wykorzystać do generowania obiektów w dowolnej z pierwotnych domen. Wygenerowane łamigłówki szachowe pojawiły się również na YouTube.

Kreatywność w rozwiązywaniu problemów

Kreatywność jest również przydatna w pozwalając na nietypowych rozwiązań w rozwiązywaniu problemów . W psychologii i kognitywistyce ten obszar badań nazywa się twórczym rozwiązywaniem problemów . Teoria kreatywności Jawnej-Niejawnej Interakcji (EII) została niedawno wdrożona przy użyciu modelu obliczeniowego opartego na CLARION , który umożliwia symulację inkubacji i wglądu w rozwiązywanie problemów. W tym projekcie kreatywności obliczeniowej nacisk kładzie się nie na wydajność per se (jak w projektach sztucznej inteligencji ), ale raczej na wyjaśnienie procesów psychologicznych prowadzących do ludzkiej kreatywności i reprodukcji danych zebranych w eksperymentach psychologicznych. Jak dotąd projekt ten odniósł sukces, zapewniając wyjaśnienie efektów inkubacji w prostych eksperymentach pamięciowych, wgląd w rozwiązywanie problemów i odtworzenie efektu zacieniania w rozwiązywaniu problemów.

Debata o „ogólnych” teoriach twórczości

Niektórzy badacze uważają, że kreatywność jest złożonym zjawiskiem, którego badanie dodatkowo komplikuje plastyczność języka, którego używamy do jej opisu. Jako „kreatywne” możemy określić nie tylko czynnik kreatywności, ale także produkt i metodę. W konsekwencji można by twierdzić, że nierealistyczne jest mówienie o ogólnej teorii twórczości . Niemniej jednak niektóre zasady generatywne są bardziej ogólne niż inne, co prowadzi niektórych zwolenników do twierdzenia, że ​​niektóre podejścia obliczeniowe są „ogólnymi teoriami”. Na przykład Stephen Thaler sugeruje, że pewne modalności sieci neuronowych są wystarczająco generatywne i wystarczająco ogólne, aby zamanifestować wysoki stopień zdolności twórczych.

Krytyka kreatywności obliczeniowej

Tradycyjne komputery, stosowane głównie w zastosowaniach kreatywności obliczeniowej, nie wspierają kreatywności, ponieważ zasadniczo przekształcają zbiór dyskretnej, ograniczonej dziedziny parametrów wejściowych w zbiór dyskretnej, ograniczonej dziedziny parametrów wyjściowych przy użyciu ograniczonego zestawu funkcji obliczeniowych. Jako taki, komputer nie może być twórczy, ponieważ wszystko na wyjściu musiało być już obecne w danych wejściowych lub algorytmach. Niektóre pokrewne dyskusje i odniesienia do pokrewnych prac są ujęte w niektórych niedawnych pracach dotyczących filozoficznych podstaw symulacji.

Matematycznie ten sam zestaw argumentów przeciwko kreatywności przedstawił Chaitin. Podobne obserwacje pochodzą z perspektywy teorii modeli. Cała ta krytyka podkreśla, że ​​kreatywność obliczeniowa jest użyteczna i może wyglądać jak kreatywność, ale nie jest to prawdziwa kreatywność, ponieważ nic nowego nie powstaje, tylko przekształca się w dobrze zdefiniowane algorytmy.

Wydarzenia

Międzynarodowa Konferencja na temat Kreatywności Obliczeniowej (ICCC) odbywa się corocznie, organizowana przez The Association for Computational Creativity. Wydarzenia z serii obejmują:

  • ICCC 2018, Salamanka, Hiszpania
  • ICCC 2017, Atlanta, Georgia, USA
  • ICCC 2016, Paryż, Francja
  • ICCC 2015, Park City, Utah, USA. Myśl przewodnia: Emily Krótka
  • ICCC 2014, Lublana, Słowenia. Myśl przewodnia: Oliver Deussen
  • ICCC 2013, Sydney, Australia. Myśl przewodnia: Arne Dietrich
  • ICCC 2012, Dublin, Irlandia. Myśl przewodnia: Steven Smith
  • ICCC 2011, Meksyk, Meksyk. Myśl przewodnia: George E. Lewis
  • ICCC 2010, Lizbona, Portugalia. Przemówienie/wykłady na zaproszenie: Nancy J Nersessian i Mary Lou Maher

Wcześniej społeczność kreatywności obliczeniowej co roku od 1999 r. organizowała specjalne warsztaty International Joint Workshop on Computational Creativity. Poprzednie wydarzenia z tej serii to:

  • IJWCC 2003, Acapulco, Meksyk, w ramach IJCAI'2003
  • IJWCC 2004, Madryt, Hiszpania, w ramach ECCBR'2004
  • IJWCC 2005, Edynburg, Wielka Brytania, w ramach IJCAI'2005
  • IJWCC 2006, Riva del Garda, Włochy, w ramach ECAI'2006
  • IJWCC 2007, Londyn, Wielka Brytania, samodzielna impreza
  • IJWCC 2008, Madryt, Hiszpania, samodzielna impreza

Odbędzie się I Konferencja Komputerowej Symulacji Twórczości Muzycznej

  • CCSMC 2016, 17–19 czerwca, University of Huddersfield, Wielka Brytania. Keynotes: Geraint Wiggins i Graeme Bailey.

Publikacje i fora

Design Computing and Cognition to konferencja poświęcona kreatywności obliczeniowej. Konferencja ACM Creativity and Cognition to kolejne forum poświęcone zagadnieniom związanym z kreatywnością obliczeniową. Przemówienie Szlomo Dubnova w Journées d'Informatique Musicale 2016 dotyczyło kreatywności teoretycznej informacji.

Kilka ostatnich książek stanowi dobre wprowadzenie lub dobry przegląd dziedziny kreatywności obliczeniowej. Obejmują one:

  • Pereira, FC (2007). „Kreatywność i sztuczna inteligencja: koncepcyjne podejście mieszania”. Zastosowania serii Cognitive Linguistics, Mouton de Gruyter.
  • Cielęcina, T. (2012). „Eksplodując mit kreatywności: podstawy obliczeniowe kreatywności językowej”. Akademicki Bloomsbury, Londyn.
  • McCormack, J. i d'Inverno, M. (red.) (2012). „Komputery i kreatywność”. Springera w Berlinie.
  • Veale T., Feyaerts K. i Forceville C. (2013, w przygotowaniu). „Kreatywność i Agile Mind: wielodyscyplinarne badanie wieloaspektowego zjawiska”. Mouton de Gruytera.

Oprócz materiałów z konferencji i warsztatów społeczność kreatywności obliczeniowej do tej pory wydała te specjalne numery czasopism poświęcone temu tematowi:

  • Obliczenia Nowej Generacji , tom 24, wydanie 3, 2006
  • Journal of Knowledge-Based Systems , tom 19, wydanie 7, listopad 2006
  • AI Magazine , tom 30, numer 3, jesień 2009
  • Umysły i Maszyny , tom 20, numer 4, listopad 2010
  • Obliczenia poznawcze , tom 4, wydanie 3, wrzesień 2012
  • AIEDAM , tom 27, nr 4, jesień 2013
  • Computers in Entertainment , dwa specjalne wydania Music Meta-Creation (MuMe), jesień 2016 (w przygotowaniu)

Oprócz tego powstało nowe czasopismo, które koncentruje się na kreatywności obliczeniowej w dziedzinie muzyki.

  • JCMS 2016, Journal of Creative Music Systems

Zobacz też

Listy

Bibliografia

Dalsza lektura

Zewnętrzne linki

Filmy dokumentalne