Xlera8

Zapomnij o zagładzie i szumie dotyczącym sztucznej inteligencji, uczyńmy komputery użytecznymi

Podejście systemowe Pełne ujawnienie: mam długą historię związaną ze sztuczną inteligencją, flirtowałem z nią w latach 1980. (pamiętacie systemy ekspertowe?), a następnie bezpiecznie uniknęliśmy zimy związanej ze sztuczną inteligencją pod koniec lat 1980., przechodząc do formalnej weryfikacji, zanim ostatecznie zdecydowałem się na networking jako moją specjalizację w 1988.

I tak jak mój kolega z Systems Approach, Larry Peterson, ma na swojej półce takie klasyki, jak podręcznik Pascala, tak ja wciąż mam na półce kilka książek o sztucznej inteligencji z lat 80., zwłaszcza książkę PH Winstona Artificial Intelligence (1984). Przeglądanie tej książki to świetna zabawa, w tym sensie, że większość z niej wygląda, jakby została napisana wczoraj. Na przykład przedmowa zaczyna się w ten sposób:

Od czasu opublikowania pierwszego wydania tej książki dziedzina sztucznej inteligencji uległa ogromnym zmianom. Przedmioty związane ze sztuczną inteligencją są obowiązkowe na studiach licencjackich na kierunku informatyka, a artykuły na temat sztucznej inteligencji regularnie pojawiają się w większości renomowanych magazynów informacyjnych. Jednym z powodów zmiany jest zgromadzenie solidnych wyników.

Zaintrygowały mnie także przykłady „tego, co potrafią komputery” z 1984 roku. Jednym z przykładów było rozwiązywanie bardzo trudnych problemów rachunku różniczkowego – co jest godne uwagi, ponieważ dokładna arytmetyka wydaje się przekraczać możliwości dzisiejszych systemów opartych na LLM.

Jeśli obliczenia różniczkowe były już rozwiązywane przez komputery w 1984 r., podczas gdy podstawowa arytmetyka zapierała dech w piersiach systemom, które uważamy za dzisiejszy stan wiedzy, być może postęp w sztucznej inteligencji w ciągu ostatnich 40 lat nie jest tak duży, jak się początkowo wydawało. (To powiedziawszy, są nawet lepszy Dzisiejsze systemy rozwiązywania problemów z rachunkiem różniczkowym po prostu nie są oparte na LLM i nie jest jasne, czy ktoś nazywa je sztuczną inteligencją.)

Jednym z powodów, dla których sięgnąłem po mój stary egzemplarz Winstona, była chęć sprawdzenia, co ma do powiedzenia na temat definicji sztucznej inteligencji, ponieważ to również jest kontrowersyjny temat. Jego pierwsze podejście do tej kwestii nie jest zbyt zachęcające:

Sztuczna inteligencja to nauka o pomysłach, które umożliwiają komputerom bycie inteligentnymi.

Cóż, OK, to dość błędne koło, ponieważ trzeba jakoś zdefiniować inteligencję, jak przyznaje Winston. Następnie podaje dwa cele sztucznej inteligencji:

  1. Aby komputery były bardziej użyteczne
  2. Aby zrozumieć zasady, które umożliwiają inteligencję.

Innymi słowy, trudno zdefiniować inteligencję, ale być może badanie sztucznej inteligencji pomoże nam lepiej zrozumieć, czym ona jest. Posunąłbym się nawet do stwierdzenia, że ​​40 lat później nadal toczymy debatę na temat tego, czym jest inteligencja. Pierwszy cel wydaje się godny pochwały, ale wyraźnie odnosi się do wielu technologii innych niż sztuczna inteligencja.

Debata na temat znaczenia „AI” nadal wisi nad branżą. Spotkałem się z wieloma tyradami, że nie potrzebowalibyśmy terminu Sztuczna Inteligencja Ogólna, czyli AGI, gdyby tylko termin AI nie był tak zanieczyszczony przez ludzi promujących modele statystyczne jako AI. Naprawdę tego nie kupuję. O ile wiem, sztuczna inteligencja zawsze obejmowała szeroki zakres technik obliczeniowych, z których większość nie dałaby nikomu wmówić, że komputer wykazuje ludzki poziom inteligencji.

Kiedy około osiem lat temu zacząłem ponownie zajmować się dziedziną sztucznej inteligencji, sieci neuronowe – z których niektórzy z moich kolegów korzystali w 1988 r., zanim wypadły z łask – w zaskakujący sposób powróciły do ​​tego stopnia, że ​​rozpoznawanie obrazów na podstawie głębokich sieci neuronowe miały przewyższał szybkość i dokładność ludzi, aczkolwiek z pewnymi zastrzeżeniami. Rozwój sztucznej inteligencji wywołał pewien poziom niepokoju wśród moich kolegów inżynierów z VMware, którzy wyczuli, że następuje ważna zmiana technologiczna, której (a) większość z nas nie rozumiała (b) nasz pracodawca nie był w stanie wykorzystać .

Kiedy rzuciłem się w wir nauki działania sieci neuronowych (za pomocą pliku duża asysta Rodney Brooks) Zdałem sobie sprawę, że język, którego używamy, mówiąc o systemach AI, ma znaczący wpływ na to, jak o nich myślimy. Na przykład do 2017 r. dużo słyszeliśmy o „głębokim uczeniu się” i „głębokich sieciach neuronowych”, a użycie słowa „głębokie” ma interesujące podwójne znaczenie. Jeśli powiem, że mam „głębokie myśli”, można sobie wyobrazić, że myślę o sensie życia lub czymś równie ważnym, a „głębokie uczenie się” zdaje się sugerować coś podobnego.

Ale tak naprawdę „głębokie” w „głębokim uczeniu się” odnosi się do głębokości mierzonej liczbą warstw sieci neuronowej, która wspiera uczenie się. Zatem nie jest to „głębokie” w sensie znaczącym, ale po prostu głębokie w taki sam sposób, w jaki basen ma głęboką końcówkę – tę, w której znajduje się więcej wody. To podwójne znaczenie przyczynia się do złudzenia, że ​​sieci neuronowe „myślą”.

Podobne zamieszanie dotyczy „uczenia się”, w którym Brooks był tak pomocny: głęboka sieć neuronowa (DNN) staje się lepsza w wykonywaniu zadania, im więcej danych treningowych ma do czynienia, więc w tym sensie „uczy się” na podstawie doświadczenia, ale sposób, w jaki się uczy, nie przypomina sposobu, w jaki uczy się człowiek.

Jako przykład uczenia się DNN rozważmy: AlphaGo, system gier wykorzystujący sieci neuronowe pokonać ludzcy arcymistrzowie. Według twórców systemu, podczas gdy człowiek z łatwością poradziłby sobie ze zmianą rozmiaru planszy (zwykle siatki 19 × 19), niewielka zmiana uczyniłaby AlphaGo bezsilną, dopóki nie zdążyłby przeszkolić się na nowych danych z planszy o zmienionym rozmiarze.

Dla mnie to dobrze ilustruje, jak „uczenie się” DNN zasadniczo różni się od uczenia się człowieka, nawet jeśli używamy tego samego słowa. Sieć neuronowa nie jest w stanie uogólniać tego, czego się „nauczyła”. I mówiąc o tym, AlphaGo było niedawno pokonany przez ludzkiego przeciwnika, który wielokrotnie stosował styl gry, który nie był uwzględniony w danych treningowych. Ta niezdolność do radzenia sobie w nowych sytuacjach wydaje się być cechą charakterystyczną systemów AI.

Język ma znaczenie

Język używany do opisu systemów AI w dalszym ciągu wpływa na to, jak o nich myślimy. Niestety, biorąc pod uwagę rozsądny sprzeciw wobec niedawnego szumu wokół sztucznej inteligencji i kilka znaczących niepowodzeń w systemach sztucznej inteligencji, może obecnie być tyle samo osób przekonanych, że sztuczna inteligencja jest całkowicie bezwartościowa, ile jest członków obozu twierdzących, że sztuczna inteligencja wkrótce osiągnie inteligencję ludzką .

Jestem bardzo sceptyczny wobec tego drugiego obozu, jak wskazano powyżej, ale uważam również, że niefortunnie byłoby stracić z oczu pozytywny wpływ, jaki mogą mieć systemy sztucznej inteligencji – lub, jeśli wolisz, systemy uczenia maszynowego.

Obecnie pomagam kilku kolegom w pisaniu książki na temat zastosowań uczenia maszynowego w sieciach i nie powinna nikogo dziwić informacja, że ​​istnieje wiele problemów z siecią, które można rozwiązać za pomocą rozwiązań opartych na uczeniu maszynowym. W szczególności ślady ruchu sieciowego są fantastycznym źródłem danych, a dane szkoleniowe to pożywienie, na którym rozwijają się systemy uczenia maszynowego.

Wszystkie aplikacje, od zapobiegania odmowie usług po wykrywanie złośliwego oprogramowania i geolokalizację, mogą korzystać z algorytmów ML, a celem tej książki jest pomoc osobom pracującym w sieci w zrozumieniu, że ML to nie magiczny proszek, który posypujesz swoje dane, aby uzyskać odpowiedzi, ale zestaw narzędzi inżynierskich, które można selektywnie zastosować w celu opracowania rozwiązań rzeczywistych problemów. Innymi słowy, ani panaceum, ani przereklamowane placebo. Celem tej książki jest pomoc czytelnikom w zrozumieniu, które narzędzia ML są odpowiednie dla różnych klas problemów sieciowych.

Historia, która jakiś czas temu przykuła moją uwagę, dotyczyła wykorzystania sztucznej inteligencji do pomocy Network Rail w Wielkiej Brytanii zarządzać roślinnością która rośnie wzdłuż brytyjskich linii kolejowych. Kluczową technologią „AI” jest tutaj rozpoznawanie obrazu (w celu identyfikacji gatunków roślin) – wykorzystując technologię dostarczaną przez DNN w ciągu ostatniej dekady. Być może nie tak ekscytujące jak generatywne systemy sztucznej inteligencji, które przykuły uwagę świata w 2023 r., ale dobre, praktyczne zastosowanie techniki leżącej pod parasolem sztucznej inteligencji.

Obecnie mam tendencję do używania terminu „uczenie maszynowe” zamiast „sztuczna inteligencja”, gdy jest to właściwe, w nadziei uniknięcia zarówno szumu, jak i reakcji alergicznych, jakie obecnie wywołuje „sztuczna inteligencja”. Mając w pamięci słowa Patricka Winstona, mógłbym po prostu zacząć mówić o „uczynieniu komputerów użytecznymi”. ®

Czat z nami

Cześć! Jak mogę ci pomóc?