More

    Os pesquisadores sugerem que a IA pode aprender o bom senso com os animais


    Os pesquisadores de IA que desenvolvem agentes de aprendizagem por reforço podem aprender muito com os animais. Isso está de acordo com uma análise recente feita por pesquisadores da DeepMind do Google, do Imperial College London e da University of Cambridge que avaliaram IA e animais não humanos.

    Em um empreendimento de décadas para o avanço da inteligência da máquina, a comunidade de pesquisa de IA frequentemente buscou inspiração na neurociência e na ciência comportamental e para entender melhor como a inteligência é formada. Mas esse esforço tem se concentrado principalmente na inteligência humana, especificamente a de bebês e crianças.

    “Isso é especialmente verdadeiro em um contexto de aprendizagem por reforço, onde, graças ao progresso na aprendizagem profunda, agora é possível aplicar os métodos de cognição comparativa diretamente”, diz o artigo dos pesquisadores. “A cognição animal fornece um compêndio de comportamento inteligente, não lingüístico e bem compreendido; sugere métodos experimentais para avaliação e benchmarking; e pode orientar o design do ambiente e da tarefa. ”

    DeepMind introduziu algumas das primeiras formas de IA para combinar aprendizado profundo e aprendizado por reforço, como o algoritmo deep Q-network (DQN), um sistema que executava vários jogos Atari em níveis sobre-humanos. AlphaGo e AlphaZero também usaram aprendizado profundo e aprendizado por reforço para treinar IA para vencer um campeão Go humano e realizar outros talentos. Mais recentemente, a DeepMind produziu IA que gera automaticamente algoritmos de aprendizagem por reforço.

    Em uma conferência de Stanford HAI no início deste mês, o diretor de pesquisa em neurociência da DeepMind, Matthew Botvinick, incentivou os profissionais de aprendizado de máquina a se envolverem em um trabalho mais interdisciplinar com neurocientistas e psicólogos.

    Ao contrário de outros métodos de treinamento de IA, o aprendizado por reforço profundo dá a um agente um objetivo e uma recompensa, uma abordagem semelhante ao treinamento de animais usando recompensas alimentares. Estudos anteriores de cognição animal analisaram várias espécies, incluindo cães e ursos. Cientistas cognitivo-comportamentais descobriram níveis mais elevados de inteligência em animais do que se supunha anteriormente, incluindo autoconsciência entre os golfinhos e atributos vingativos dos corvos.

    Os estudos que exploram as habilidades cognitivas dos animais também podem inspirar os pesquisadores de IA a olhar para os problemas de maneira diferente, especialmente no campo da aprendizagem por reforço profundo. À medida que os pesquisadores traçam paralelos entre os animais em cenários de teste e os agentes de aprendizagem por reforço, a ideia de testar as habilidades cognitivas dos sistemas de IA evoluiu. Outras formas de IA, como os assistentes Alexa ou Siri, por exemplo, não podem procurar em um labirinto por uma caixa contendo uma recompensa ou comida.

    Publicado na CellPress Reviews, o artigo da equipe de pesquisa – “Inteligência Artificial e o Senso Comum dos Animais” – cita experimentos cognitivos com pássaros e primatas.

    “Idealmente, gostaríamos de construir uma tecnologia de IA que possa compreender esses princípios e conceitos inter-relacionados como um todo sistemático e que manifeste essa compreensão em uma capacidade de generalizar e inovar no nível humano”, diz o artigo. “Como construir essa tecnologia de IA permanece uma questão em aberto. Mas defendemos uma abordagem em que os agentes RL, talvez com arquiteturas ainda não desenvolvidas, adquiram o que é necessário por meio de interação estendida com ambientes virtuais ricos. ”

    Quando se trata de construir sistemas como os mencionados no artigo, os desafios incluem ajudar os agentes a sentir que existem em um mundo independente. Treinar agentes para compreender o conceito de bom senso é outro obstáculo, juntamente com a identificação dos tipos de ambientes e desafios mais adequados para a tarefa.

    Um pré-requisito para treinar agentes para usar o bom senso são mundos simulados em 3D com física realista. Eles podem simular objetos do cotidiano, como conchas que podem ser quebradas, tampas que podem ser desparafusadas e pacotes que podem ser abertos.

    “Isso está dentro das capacidades tecnológicas dos motores de física atuais, mas esses ambientes ricos e realistas ainda precisam ser implantados em escala para o treinamento de agentes RL”, diz o artigo.

    Os pesquisadores argumentam que, embora o senso comum não seja um traço exclusivamente humano, ele depende de alguns conceitos básicos, como entender o que é um objeto, como o objeto ocupa espaço e a relação entre causa e efeito. Entre esses princípios está a habilidade de perceber um objeto como algo semipermanente que pode permanecer razoavelmente persistente ao longo do tempo.

    As formas de cognição exibidas pelos animais incluem a compreensão da permanência dos objetos e da possibilidade de uma recompensa dentro de um recipiente, como uma semente dentro de uma casca. O desafio de dotar os agentes de tais princípios de bom senso pode ser lançado como o problema de encontrar tarefas e currículos que, dada a arquitetura certa, resultarão em agentes treinados que podem passar por tarefas de transferência adequadamente projetadas.

    “Embora os agentes RL profundos contemporâneos possam aprender a resolver múltiplas tarefas de maneira muito eficaz, e algumas arquiteturas mostrem formas rudimentares de transferência, está longe de ser claro se qualquer arquitetura RL atual é capaz de adquirir um conceito tão abstrato. Mas suponha que tivéssemos um candidato a agente, como testaríamos se ele adquiriu o conceito de contêiner? ”

    Os pesquisadores acreditam que o treinamento deve basear-se em abordagens que requerem compreensão sem exposição a muitos exemplos, também conhecido como aprendizado de poucas tentativas ou zero de tentativas.

    O estudo foi focado em um aspecto da física do senso comum e não leva em conta outras expressões do senso comum, como conceitos psicológicos, a capacidade de determinar diferentes formas de objetos (como líquidos ou gases), ou a compreensão de objetos que podem ser manipulado (como papel ou uma esponja).

    Em outros desenvolvimentos recentes de aprendizagem por reforço, o professor da UC Berkeley, Ion Stoica, falou na conferência Transform da VentureBeat sobre por que a aprendizagem supervisionada é muito mais comumente usada do que a aprendizagem por reforço. Os pesquisadores da Universidade de Stanford também introduziram o LILAC para melhorar o aprendizado por reforço em ambientes dinâmicos, e os pesquisadores da Georgia Tech combinaram PNL e aprendizado por reforço para criar IA que se destaca em jogos de aventura em texto.


    O problema de áudio:

    Aprenda como novas soluções de API baseadas em nuvem estão resolvendo áudio imperfeito e frustrante em videoconferências. Acesse aqui



    Artigos Recentes

    É assim que vamos nos fundir com a IA

    A relação entre humanos e IA é uma espécie de dança. Nós e a IA nos aproximamos operando de forma colaborativa, então...

    Miniusuários do Apple HomePod com problemas graves de Wi-Fi

    Alguns usuários do Apple HomePod mini estão relatando um problema com a conectividade Wi-Fi, com apenas uma correção temporária em jogo. Um tópico nos...

    A tecnologia está transformando o setor de seguros

    A indústria de seguros, por muito tempo, foi impulsionada por modelos de negócios tradicionais. Ela continuou seu processo de negócios e produtos...

    A promessa e o desafio do futuro da Roblox na China

    Em uma mudança muito esperada, a empresa de jogos Roblox, com sede na Califórnia arquivado para ir a público na semana passada....

    Artigos Relacionados

    DEIXE UMA RESPOSTA

    Por favor digite seu comentário!
    Por favor, digite seu nome aqui