Xlera8

Felejtsd el a mesterséges intelligencia végzetét és a hype-ot, tegyük hasznossá a számítógépeket

Rendszerszemléletű megközelítés Teljes nyilvánosságra hozatal: Történelmem van a mesterséges intelligenciával kapcsolatban, az 1980-as években flörtöltem vele (emlékszel a szakértői rendszerekre?), majd biztonságosan elkerültem az 1980-as évek végi mesterséges intelligencia telét azáltal, hogy hivatalos ellenőrzésre tértem át, mielőtt végül a hálózatépítésre, mint szakterületemre tértem volna. 1988.

És ahogy a Systems Approach kollégámnak, Larry Petersonnak is vannak olyan klasszikusai a könyvespolcán, mint a Pascal-kézikönyv, nekem is van még néhány mesterséges intelligencia-könyv a nyolcvanas évekből, különösen PH Winston könyve. Mesterséges Intelligencia (1984). Abban a könyvben lapozgatni elég durva abban az értelemben, hogy nagy része úgy néz ki, mintha tegnap írták volna. Például az előszó így kezdődik:

A mesterséges intelligencia területe óriásit változott e könyv első kiadása óta. A mesterséges intelligencia tantárgyak az alapképzésben részt vevő informatikai tudományok szakos hallgatói, és a mesterséges intelligenciával kapcsolatos történetek rendszeresen szerepelnek a legtöbb neves hírmagazinban. A változás oka részben az, hogy szilárd eredmények halmozódtak fel.

Az is érdekelt, hogy lássam néhány 1984-es példát arra vonatkozóan, hogy „mire képesek a számítógépek”. Az egyik példa a komolyan nehéz számítási feladatok megoldása volt – figyelemre méltó, mert úgy tűnik, hogy a pontos aritmetika meghaladja a mai LLM-alapú rendszerek képességeit.

Ha a számításokat már 1984-ben megoldották a számítógépek, miközben az alapvető aritmetika tönkreteszi azokat a rendszereket, amelyeket a technika mai szintjének tekintünk, akkor az AI terén az elmúlt 40 évben elért haladás mértéke talán nem olyan nagy, mint amilyennek elsőre tűnik. (Egyébként vannak ilyenek is jobb Napjainkban a számítástechnikai rendszerek egyszerűen nem LLM-eken alapulnak, és nem világos, hogy valaki mesterséges intelligenciaként hivatkozik-e rájuk.)

Az egyik ok, amiért elővettem a régi Winston-példányomat, az volt, hogy lássam, mit mond az AI definíciójáról, mert ez is vitatott téma. Az első véleménye ezzel kapcsolatban nem túl biztató:

A mesterséges intelligencia olyan ötletek tanulmányozása, amelyek lehetővé teszik a számítógépek intelligens működését.

Nos, rendben, ez elég körkörös, mivel valahogy meg kell határozni az intelligenciát, ahogy Winston is elismeri. De ezután kijelenti az AI két célját:

  1. A számítógépek hasznosabbá tétele
  2. Megérteni azokat az elveket, amelyek lehetővé teszik az intelligenciát.

Más szóval, nehéz meghatározni az intelligenciát, de talán a mesterséges intelligencia tanulmányozása segít jobban megérteni, mi is az. Elmennék odáig, hogy azt mondanám, hogy még 40 évvel később is vitatkozunk arról, hogy mi számít intelligencia. Az első cél dicséretesnek tűnik, de egyértelműen sok nem mesterséges intelligencia technológiára vonatkozik.

Az „AI” jelentéséről szóló vita továbbra is az iparág felett lóg. Rengeteg riadozással találkoztam, hogy nem lenne szükségünk a mesterséges intelligencia, más néven AGI kifejezésre, ha az AI kifejezést nem szennyezték volna annyira a statisztikai modelleket, mint az AI-t hirdető emberek. Nem igazán veszek ilyet. Amennyire meg tudom állapítani, a mesterséges intelligencia mindig is a számítástechnikai technikák széles skáláját fedte le, amelyek többsége senkit sem téveszt meg azzal, hogy a számítógép emberi szintű intelligenciát jelenít meg.

Amikor körülbelül nyolc évvel ezelőtt elkezdtem újra foglalkozni a mesterséges intelligencia területével, a neurális hálózatok – amelyeket néhány kollégám 1988-ban használt, mielőtt a kegyvesztett lett volna – megdöbbentően visszatértek, egészen addig a pontig, ahol a mély képfelismerés. neurális hálózatok rendelkeztek meghaladta az emberek gyorsasága és pontossága, bár bizonyos megkötésekkel. A mesterséges intelligencia ezen térnyerése bizonyos mértékű aggodalomhoz vezetett a VMware-nél dolgozó mérnök kollégáim körében, akik úgy érezték, hogy fontos technológiai váltás van folyamatban, amelyet (a) legtöbbünk nem értett (b) munkaadónk nincs abban a helyzetben, hogy kihasználja a .

Miközben belevetettem magam abba a feladatba, hogy megtanuljam a neurális hálózatok működését (a nagy segítség Rodney Brookstól) Rájöttem, hogy az AI-rendszerekről beszélünk nyelve jelentős hatással van arra, hogyan gondolkodunk róluk. 2017-re például sokat hallottunk a „mély tanulásról” és a „mély neurális hálózatokról”, és a „mély” szó használatának érdekes kettős jelentése van. Ha azt mondom, hogy „mély gondolataim” vannak, azt képzelhetjük, hogy az élet értelmére vagy valami hasonlóan fontos dologra gondolok, és a „mély tanulás” valami hasonlót sejtet.

De valójában a „mélység” a „mély tanulásban” a tanulást támogató neurális hálózat rétegek számában mért mélységére utal. Tehát nem az értelmes értelemben „mély”, hanem éppúgy mély, ahogyan az uszodának van egy mély vége – annak, ahol több víz van. Ez a kettős jelentés hozzájárul ahhoz az illúzióhoz, hogy a neurális hálózatok „gondolkodnak”.

Hasonló zavar vonatkozik a „tanulásra” is, ahol Brooks nagyon sokat segített: a mély neurális hálózat (DNN) annál jobban teljesít egy feladatban, minél több képzési adatnak van kitéve, tehát ebben az értelemben „tanul” a tapasztalatból, de a tanulás módja nem hasonlít ahhoz, ahogyan az ember tanul dolgokat.

Példaként a DNN-ek tanulására gondoljon AlphaGo, a neurális hálózatokat használó játékrendszer vereség emberi nagymesterek. A rendszerfejlesztők szerint míg az ember könnyen kezelné a tábla méretének megváltoztatását (általában egy 19×19-es rács), egy kis változtatás impotenssé tenné az AlphaGo-t mindaddig, amíg nem lesz ideje oktatni az átméretezett tábláról származó új adatokra.

Számomra ez jól szemlélteti, hogy a DNN-ek „tanulása” alapvetően különbözik az emberi tanulástól, még akkor is, ha ugyanazt a szót használjuk. A neurális hálózat nem tud általánosítani abból, amit „tanult”. És ezzel kapcsolatban az AlphaGo nemrég volt legyőzött egy emberi ellenfél által, aki többször is olyan játékstílust használt, amely nem szerepelt az edzésadatokban. Úgy tűnik, hogy az új helyzetek kezelésének képtelensége az AI-rendszerek jellemzője.

A nyelv számít

Az AI-rendszerek leírására használt nyelv továbbra is befolyásolja, hogyan gondolkodunk róluk. Sajnos, tekintettel a közelmúltbeli mesterséges intelligencia-felhajtás ésszerű visszaszorítására, és az AI-rendszerek jelentős kudarcaira, mostanra annyi ember lehet meggyőződve arról, hogy a mesterséges intelligencia teljesen értéktelen, mint ahány tagja annak a tábornak, amely szerint a mesterséges intelligencia hamarosan emberszerű intelligenciát fog elérni. .

Erősen szkeptikus vagyok az utóbbi táborral kapcsolatban, amint azt fentebb vázoltam, de azt is gondolom, hogy sajnálatos lenne szem elől téveszteni azt a pozitív hatást, amelyet az AI-rendszerek – vagy ha úgy tetszik, a gépi tanulási rendszerek – gyakorolhatnak.

Jelenleg pár kollégámnak segítek egy könyv megírásában a hálózati gépi tanulási alkalmazásokról, és senkit sem lep meg, ha azt hallja, hogy sok olyan hálózati probléma van, amely kezelhető ML-alapú megoldásokkal. Különösen a hálózati forgalom nyomai fantasztikus adatforrások, a képzési adatok pedig az a táplálék, amelyen a gépi tanulási rendszerek fejlődnek.

A szolgáltatásmegtagadás megelőzésétől a rosszindulatú programok észlelésén át a földrajzi helymeghatározásig minden alkalmazás használhatja az ML algoritmusokat, és ennek a könyvnek az a célja, hogy segítsen a hálózatépítő embereknek megérteni, hogy az ML nem valami varázspor, amelyet az adatokra szór, hogy megszerezze. válaszokat, hanem olyan mérnöki eszközöket, amelyek szelektíven alkalmazhatók valódi problémák megoldására. Más szóval, se nem csodaszer, se nem túlzásba vitt placebo. A könyv célja, hogy az olvasók megértsék, mely ML eszközök alkalmasak a hálózati problémák különböző osztályaira.

Az egyik történet, amelyre felfigyeltem valamikor, az volt, hogy a mesterséges intelligencia segítségével segítették a Network Rail-t az Egyesült Királyságban kezelni a növényzetet amely a brit vasútvonalak mellett nő. A kulcsfontosságú „AI” technológia itt a képfelismerés (a növényfajok azonosítására) – kihasználva azt a fajta technológiát, amelyet a DNN-ek az elmúlt évtizedben biztosítottak. Talán nem annyira izgalmas, mint a generatív mesterséges intelligencia rendszerek, amelyek 2023-ban felkeltették a világ figyelmét, de egy jó, gyakorlati alkalmazás egy olyan technikának, amely az AI ernyője alatt áll.

Manapság az a tendenciám, hogy megpróbálom a „gépi tanulás” kifejezést használni az MI helyett, amikor ez helyénvaló, abban a reményben, hogy elkerülhetem mind a hype-ot, mind az allergiás reakciókat, amelyeket az „AI” most produkál. És Patrick Winston szavai frissen eszembe jutnak, talán csak a „számítógépek hasznossá tételéről” beszélnék. ®

Beszélj velünk

Szia! Miben segíthetek?