Niekończąca się nauka języka - Never-Ending Language Learning

System Never-Ending Language Learning ( NELL ) to semantyczny system uczenia maszynowego opracowany przez zespół badawczy z Carnegie Mellon University i wspierany przez granty DARPA , Google , NSF i CNPq, przy czym części systemu działają w klastrze superkomputerowym dostarczonym przez Wieśniak! .

Proces i cele

NELL został zaprogramowany przez programistów, aby był w stanie zidentyfikować podstawowy zestaw podstawowych relacji semantycznych między kilkuset predefiniowanymi kategoriami danych, takimi jak miasta, firmy, emocje i drużyny sportowe. Od początku 2010 roku zespół badawczy Carnegie Mellon prowadzi NELL przez całą dobę, przeszukując setki milionów stron internetowych w poszukiwaniu powiązań między informacjami, które już zna, a tym, co znajduje w procesie wyszukiwania - aby nawiązać nowe połączenia sposób, który ma naśladować sposób, w jaki ludzie uczą się nowych informacji. Na przykład, napotykając parę słów „Pikes Peak”, NELL zauważyłby, że oba słowa są pisane wielką literą i wywnioskowałby z drugiego słowa, że ​​jest to nazwa góry, a następnie zbudowałby związek słów otaczających te dwa słowa, aby wywnioskować inne połączenia.

Celem NELL i inne systemy semantyczne uczenia się, takich jak IBM „s Watson systemie ma być w stanie opracować sposoby odpowiadania na pytania stawiane przez użytkowników w języku naturalnym, bez interwencji człowieka w tym procesie. Oren Etzioni z University of Washington wychwalał system „ciągłego uczenia się, tak jakby NELL sam przejawiał ciekawość, przy niewielkiej pomocy człowieka”.

Do października 2010 r. Firma NELL podwoiła liczbę relacji dostępnych w swojej bazie wiedzy i poznała 440 000 nowych faktów z dokładnością 87%. Lider zespołu Tom M. Mitchell , prezes działu uczenia maszynowego w Carnegie Mellon, opisał, w jaki sposób NELL „samokoryguje się, gdy ma więcej informacji, ponieważ uczy się więcej”, chociaż czasami dochodzi do błędnych wniosków. Nagromadzone błędy, takie jak wywnioskowanie, że ciasteczka internetowe były rodzajem wypieku, skłoniły NELL do wywnioskowania ze zwrotów „Usunąłem moje internetowe ciasteczka” i „Usunąłem swoje pliki”, że „ pliki komputerowe ” również należały do ​​kategorii wypieków . Takie wyraźne błędy są poprawiane co kilka tygodni przez członków zespołu badawczego, a system może kontynuować proces uczenia się.

Według stanu na styczeń 2020 r., Ostatnie zebrane fakty dotyczące projektu pochodzą z lutego 2019 r.

Komentarze

W swojej książce „ Human Compatible ” z 2019 roku Stuart Russell skomentował: „Niestety NELL ma zaufanie tylko do 3 procent swoich przekonań i polega na ludzkich ekspertach, którzy regularnie usuwają fałszywe lub pozbawione znaczenia przekonania - takie jak przekonania, że„ Nepal jest kraj znany również jako Stany Zjednoczone ”, a„ wartość to produkt rolny, który jest zwykle pocięty na podstawowe ”.

Zobacz też

Bibliografia

Linki zewnętrzne