Xlera8Name

Esqueça a destruição e o hype da IA, vamos tornar os computadores úteis

Abordagem de sistemas Divulgação completa: tenho uma história com IA, tendo flertado com ela na década de 1980 (lembra dos sistemas especialistas?) e depois evitado com segurança o inverno da IA ​​do final da década de 1980, desviando-me para a verificação formal antes de finalmente adotar redes como minha especialidade em 1988.

E assim como meu colega de Abordagem de Sistemas, Larry Peterson, tem clássicos como o manual de Pascal em sua estante, ainda tenho alguns livros sobre IA dos anos 80 na minha, principalmente o de PH Winston. Inteligência artificial (1984). Folhear esse livro é incrível, no sentido de que grande parte dele parece ter sido escrito ontem. Por exemplo, o prefácio começa assim:

O campo da Inteligência Artificial mudou enormemente desde a publicação da primeira edição deste livro. Disciplinas de Inteligência Artificial são obrigatórias para cursos de graduação em ciência da computação, e histórias sobre Inteligência Artificial são regularmente apresentadas na maioria das revistas de notícias de renome. Parte da razão para a mudança é que resultados sólidos se acumularam.

Também fiquei intrigado ao ver alguns exemplos de 1984 sobre “o que os computadores podem fazer”. Um exemplo foi a resolução de problemas de cálculo seriamente difíceis – notável porque a aritmética precisa parece estar além das capacidades dos sistemas atuais baseados em LLM.

Se o cálculo já era solucionável por computadores em 1984, enquanto a aritmética básica confunde os sistemas que consideramos o estado da arte de hoje, talvez a quantidade de progresso na IA nos últimos 40 anos não seja tão grande como parece à primeira vista. (Dito isto, há até better sistemas de combate ao cálculo hoje, eles simplesmente não são baseados em LLMs, e não está claro se alguém se refere a eles como IA.)

Um dos motivos pelos quais peguei meu antigo exemplar de Winston foi para ver o que ele tinha a dizer sobre a definição de IA, porque esse também é um tema controverso. Sua primeira opinião sobre isso não é muito encorajadora:

Inteligência Artificial é o estudo de ideias que permitem que os computadores sejam inteligentes.

Bem, tudo bem, isso é bastante circular, já que é preciso definir inteligência de alguma forma, como admite Winston. Mas ele então afirma dois objetivos da IA:

  1. Para tornar os computadores mais úteis
  2. Compreender os princípios que tornam a inteligência possível.

Em outras palavras, é difícil definir inteligência, mas talvez o estudo da IA ​​nos ajude a compreender melhor o que ela é. Eu iria mais longe e diria que ainda estamos em debate sobre o que constitui inteligência 40 anos depois. O primeiro objetivo parece louvável, mas aplica-se claramente a muitas tecnologias não relacionadas à IA.

Este debate sobre o significado de “IA” continua a pairar sobre a indústria. Já me deparei com muitos argumentos de que não precisaríamos do termo Inteligência Geral Artificial, também conhecido como AGI, se ao menos o termo IA não tivesse sido tão poluído por pessoas que comercializam modelos estatísticos como IA. Eu realmente não acredito nisso. Pelo que posso dizer, a IA sempre cobriu uma ampla gama de técnicas de computação, a maioria das quais não enganaria ninguém fazendo-o pensar que o computador estava exibindo níveis humanos de inteligência.

Quando comecei a me envolver novamente com o campo da IA, há cerca de oito anos, as redes neurais – que alguns dos meus colegas usavam em 1988, antes de caírem em desuso – tinham feito um retorno surpreendente, ao ponto em que o reconhecimento de imagens por profundidade redes neurais tiveram ultrapassado a velocidade e precisão dos humanos, embora com algumas ressalvas. Essa ascensão da IA ​​gerou um certo nível de ansiedade entre meus colegas engenheiros da VMware, que perceberam que uma importante mudança tecnológica estava em andamento e que (a) a maioria de nós não entendia (b) nosso empregador não estava posicionado para tirar vantagem disso. .

Ao me dedicar à tarefa de aprender como as redes neurais funcionam (com um grande ajuda de Rodney Brooks) Percebi que a linguagem que usamos para falar sobre sistemas de IA tem um impacto significativo na forma como pensamos sobre eles. Por exemplo, em 2017 ouvíamos muito sobre “aprendizado profundo” e “redes neurais profundas”, e o uso da palavra “profundo” tem um duplo significado interessante. Se eu disser que estou tendo “pensamentos profundos”, você pode imaginar que estou pensando no significado da vida ou em algo igualmente importante, e “aprendizado profundo” parece implicar algo semelhante.

Mas na verdade o “profundo” em “aprendizagem profunda” é uma referência à profundidade, medida em número de camadas, da rede neural que suporta a aprendizagem. Portanto, não é “profundo” no sentido de significativo, mas apenas profundo, da mesma forma que uma piscina tem um fundo profundo – aquele com mais água dentro. Este duplo sentido contribui para a ilusão de que as redes neurais estão “pensando”.

Uma confusão semelhante se aplica ao “aprendizado”, que é onde Brooks foi tão útil: uma rede neural profunda (DNN) melhora em uma tarefa quanto mais dados de treinamento é exposta, então, nesse sentido, ela “aprende” com a experiência, mas a maneira como aprende não se parece em nada com a maneira como um ser humano aprende as coisas.

Como exemplo de como as DNNs aprendem, considere AlphaGo, o sistema de jogo que usava redes neurais para derrotar grandes mestres humanos. De acordo com os desenvolvedores do sistema, enquanto um ser humano lidaria facilmente com uma mudança no tamanho do tabuleiro (normalmente uma grade 19×19), uma pequena mudança tornaria o AlphaGo impotente até que tivesse tempo de treinar com novos dados do tabuleiro redimensionado.

Para mim, isso ilustra claramente como o “aprendizado” das DNNs é fundamentalmente diferente do aprendizado humano, mesmo se usarmos a mesma palavra. A rede neural é incapaz de generalizar a partir do que “aprendeu”. E enfatizando esse ponto, AlphaGo foi recentemente derrotado por um oponente humano que usou repetidamente um estilo de jogo que não constava dos dados de treinamento. Esta incapacidade de lidar com novas situações parece ser uma marca registrada dos sistemas de IA.

Questões de linguagem

A linguagem usada para descrever os sistemas de IA continua a influenciar a forma como pensamos sobre eles. Infelizmente, dada a resistência razoável ao recente hype da IA ​​e algumas falhas notáveis ​​com sistemas de IA, pode haver agora tantas pessoas convencidas de que a IA é completamente inútil quanto há membros do campo que dizem que a IA está prestes a alcançar inteligência semelhante à humana. .

Sou altamente cético em relação a este último campo, conforme descrito acima, mas também penso que seria lamentável perder de vista o impacto positivo que os sistemas de IA – ou, se preferir, os sistemas de aprendizagem automática – podem ter.

Atualmente, estou ajudando alguns colegas a escrever um livro sobre aplicativos de aprendizado de máquina para redes, e não deveria surpreender ninguém saber que há muitos problemas de rede que são passíveis de soluções baseadas em ML. Em particular, os vestígios de tráfego de rede são fontes fantásticas de dados, e os dados de treinamento são o alimento com o qual os sistemas de aprendizado de máquina prosperam.

Aplicativos que vão desde prevenção de negação de serviço até detecção de malware e geolocalização podem fazer uso de algoritmos de ML, e o objetivo deste livro é ajudar o pessoal de rede a entender que ML não é um pó mágico que você espalha em seus dados para obter respostas, mas um conjunto de ferramentas de engenharia que podem ser aplicadas seletivamente para produzir soluções para problemas reais. Em outras palavras, nem uma panacéia nem um placebo exagerado. O objetivo do livro é ajudar os leitores a compreender quais ferramentas de ML são adequadas para diferentes classes de problemas de rede.

Uma história que me chamou a atenção há algum tempo foi o uso da IA ​​para ajudar a Network Rail no Reino Unido administrar a vegetação que cresce ao longo das linhas ferroviárias britânicas. A principal tecnologia de “IA” aqui é o reconhecimento de imagens (para identificar espécies de plantas) – aproveitando o tipo de tecnologia que as DNNs forneceram na última década. Talvez não tão emocionante quanto os sistemas generativos de IA que chamaram a atenção do mundo em 2023, mas uma aplicação boa e prática de uma técnica que está sob a égide da IA.

Minha tendência hoje em dia é tentar usar o termo “aprendizado de máquina” em vez de IA quando for apropriado, na esperança de evitar tanto o exagero quanto as reações alérgicas que a “IA” produz agora. E com as palavras de Patrick Winston frescas em minha mente, talvez eu comece a falar sobre “tornar os computadores úteis”. ®

Fale Conosco

Olá! Como posso ajudá-lo?