More

    Estamos entrando na zona de penumbra da IA ​​entre IA estreita e geral


    Com os avanços recentes, a indústria de tecnologia está deixando os confins da inteligência artificial estreita (IA) e entrando em uma zona crepuscular, uma área mal definida entre a IA estreita e a geral.

    Até o momento, todos os recursos atribuídos ao aprendizado de máquina e IA estão na categoria de IA restrita. Não importa o quão sofisticado – de classificação de seguro a detecção de fraude para controle de qualidade de fabricação e combates aéreos ou mesmo auxiliando na pesquisa de fissão nuclear – cada algoritmo foi capaz de atender a apenas um único propósito. Isso significa algumas coisas: 1) um algoritmo projetado para fazer uma coisa (digamos, identificar objetos) não pode ser usado para outra coisa (jogar um videogame, por exemplo) e 2) qualquer coisa que um algoritmo “aprende” não pode ser eficaz transferido para outro algoritmo projetado para cumprir uma finalidade específica diferente. Por exemplo, AlphaGO, o algoritmo que superou o campeão mundial humano no jogo Go, não pode jogar outros jogos, apesar de esses jogos serem muito mais simples.

    Muitos dos principais exemplos de IA hoje usam modelos de aprendizado profundo implementados usando redes neurais artificiais. Ao emular neurônios cerebrais conectados, essas redes funcionam em unidades de processamento gráfico (GPUs) – microprocessadores muito avançados projetados para executar centenas ou milhares de operações de computação em paralelo, milhões de vezes a cada segundo. As inúmeras camadas da rede neural destinam-se a emular sinapses, refletindo o número de parâmetros que o algoritmo deve avaliar. Hoje, grandes redes neurais podem ter 10 bilhões de parâmetros. As funções do modelo simulam o cérebro, distribuindo informações em cascata de camada a camada na rede – cada camada avaliando outro parâmetro – para refinar a saída algorítmica. Por exemplo, no processamento de imagem, as camadas inferiores podem identificar bordas, enquanto as camadas superiores podem identificar os conceitos relevantes para um ser humano, como dígitos ou faces.

    (Acima: Redes Neurais de Aprendizagem Profunda. Fonte: Lucy Reading in Quanta Magazine.)

    Embora seja possível acelerar ainda mais esses cálculos e adicionar mais camadas na rede neural para acomodar tarefas mais sofisticadas, há restrições que se aproximam rapidamente no poder de computação e no consumo de energia que limitam o quanto o paradigma atual pode funcionar. Esses limites podem gerar outro “inverno de IA”, em que as expectativas da tecnologia não correspondem ao exagero, reduzindo assim a implementação e o investimento futuro. Isso já aconteceu duas vezes na história da IA ​​- nas décadas de 1980 e 1990 – e levou muitos anos a cada vez para ser superado, à espera de avanços na técnica ou nas capacidades de computação.

    Evitar outro inverno de IA exigirá poder de computação adicional, talvez de processadores especializados para funções de IA que estão em desenvolvimento e devem ser mais eficazes e eficientes do que as GPUs da geração atual, reduzindo o consumo de energia. Dezenas de empresas estão trabalhando em novos designs de processador, projetados para acelerar os algoritmos necessários para IA, minimizando ou eliminando circuitos que dariam suporte a outros usos. Outra forma de possivelmente evitar um inverno de IA requer uma mudança de paradigma, indo além do atual modelo de aprendizado profundo / rede neural. Maior poder de computação e / ou uma mudança de paradigma pode levar a um movimento além da IA ​​estreita em direção à “IA geral”, também conhecida como inteligência geral artificial (AGI).

    Estamos mudando?

    Ao contrário dos algoritmos de IA estreitos, o conhecimento obtido pela IA geral pode ser compartilhado e retido entre os componentes do sistema. Em um modelo geral de IA, o algoritmo que pode derrotar os melhores do mundo em Alpha Go seria capaz de aprender xadrez ou qualquer outro jogo. AGI é concebido como um sistema geralmente inteligente que pode agir e pensar como os humanos, embora na velocidade dos sistemas de computador mais rápidos.

    Até o momento, não há exemplos de um sistema AGI, e a maioria acredita que ainda há um longo caminho até esse limite. No início deste ano, Geoffrey Hinton, professor da Universidade de Toronto que é um pioneiro do aprendizado profundo, observou: “Há um trilhão de sinapses em um centímetro cúbico do cérebro. Se existe algo como IA geral, [the system] provavelmente exigiria um trilhão de sinapses. ”

    No entanto, há especialistas que acreditam que a indústria está em um ponto de inflexão, mudando de IA estreita para AGI. Certamente, também, há aqueles que afirmam que já estamos vendo um exemplo inicial de um sistema AGI na rede neural de processamento de linguagem natural GPT-3 (PNL) recentemente anunciada. Embora os sistemas de PNL sejam normalmente treinados em um grande corpo de texto (esta é a abordagem de aprendizado supervisionado que requer que cada pedaço de dados seja rotulado), os avanços em direção a AGI exigirão um aprendizado não supervisionado aprimorado, onde a IA é exposta a muitos dados não rotulados e deve descobrir tudo o mais sozinho. Isso é o que o GPT-3 faz; ele pode aprender com qualquer texto.

    O GPT-3 “aprende” com base em padrões que descobre em dados coletados da internet, de postagens do Reddit à Wikipedia, ficção de fãs e outras fontes. Com base nesse aprendizado, o GPT-3 é capaz de muitas tarefas diferentes sem nenhum treinamento adicional, capaz de produzir narrativas convincentes, gerar código de computador, preencher automaticamente imagens, traduzir entre idiomas e realizar cálculos matemáticos, entre outros feitos, incluindo alguns que seus criadores não planejaram. Essa aparente capacidade multifuncional não se parece muito com a definição de IA estreita. Na verdade, é muito mais geral em função.

    Com 175 bilhões de parâmetros, o modelo vai muito além dos 10 bilhões nas redes neurais mais avançadas e muito além dos 1,5 bilhão de seu predecessor, GPT-2. Isso é um aumento de mais de 10 vezes na complexidade do modelo em pouco mais de um ano. Indiscutivelmente, esta é a maior rede neural já criada e consideravelmente mais próxima do nível de um trilhão sugerido por Hinton para AGI. O GPT-3 demonstra que o que passa por inteligência pode ser uma função da complexidade computacional, que surge com base no número de sinapses. Como sugere Hinton, quando os sistemas de IA se tornam comparáveis ​​em tamanho aos cérebros humanos, eles podem muito bem se tornar tão inteligentes quanto as pessoas. Esse nível pode ser alcançado mais cedo do que o esperado se os relatórios das próximas redes neurais com um trilhão de parâmetros forem verdadeiros.

    O meio

    Então, o GPT-3 é o primeiro exemplo de um sistema AGI? Isso é discutível, mas o consenso é que não é AGI. No entanto, mostra que despejar mais dados e mais tempo de computação e poder no paradigma de aprendizado profundo pode levar a resultados surpreendentes. O fato de o GPT-3 ser digno de um “isso é AGI?” A conversa aponta para algo importante: sinaliza uma mudança radical no desenvolvimento da IA.

    Isso é impressionante, especialmente porque o consenso de várias pesquisas de especialistas em IA sugere que a AGI ainda está décadas no futuro. No mínimo, o GPT-3 nos diz que existe um meio-termo entre a IA estreita e a geral. É minha convicção que o GPT-3 não se encaixa perfeitamente na definição de IA estreita ou IA geral. Em vez disso, mostra que avançamos para uma zona de penumbra. Assim, o GPT-3 é um exemplo do que estou chamando de “IA de transição”.

    Essa transição pode durar apenas alguns anos, ou pode durar décadas. O primeiro é possível se os avanços nos novos designs de chips de IA forem rápidos e a inteligência realmente surgir da complexidade. Mesmo sem isso, o desenvolvimento da IA ​​está se movendo rapidamente, evidenciado por ainda mais avanços com caminhões sem motorista e caças autônomos.

    Ainda há um debate considerável sobre se alcançar IA geral é uma coisa boa ou não. Como acontece com toda tecnologia avançada, a IA pode ser usada para resolver problemas ou para propósitos nefastos. AGI pode levar a um mundo mais utópico – ou a uma maior distopia. As chances são de que serão os dois, e parece que vai chegar muito mais cedo do que o esperado.

    Gary Grossman é o vice-presidente sênior de prática de tecnologia da Edelman e líder global do Edelman AI Center of Excellence.




    Artigos Recentes

    Alibaba disputa um pedaço do próspero mercado de EV da China

    Não faltam notícias hoje em dia sobre as gigantes da tecnologia da China se unirem às montadoras tradicionais. Empresas de Alibaba a...

    Este minúsculo SSD portátil de 480GB custa US $ 40 na Black Friday – economize US $ 110!

    O Digital Trends pode ganhar uma comissão quando você compra por meio de links em nosso site. Se você estiver comprando um novo telefone,...

    Tratando seu estresse com tecnologia de IA

    Ansiedade, estresse, pensamento excessivo e trauma são palavras comumente usadas para descrever pessoas que sofrem de transtornos mentais que surgem por sobrecarga de...

    Guia de presentes: 5 presentes de tecnologia sólida para ajudar a diminuir o estresse e aumentar o sono

    Bem-vindo ao Guia de Presentes de Natal 2020 do TechCrunch! Precisa de ajuda com ideias para presentes? Nós estamos aqui para...

    Artigos Relacionados

    DEIXE UMA RESPOSTA

    Por favor digite seu comentário!
    Por favor, digite seu nome aqui