More

    Os segredos dos pequenos dados: como o aprendizado de máquina finalmente chegou à empresa


    Na última década, “big data” se tornou a maior palavra da moda no Vale do Silício. Quando são treinados em grandes conjuntos de dados entorpecentes, os modelos de aprendizado de máquina (ML) podem desenvolver uma compreensão profunda de um determinado domínio, levando a inovações para as principais empresas de tecnologia. O Google, por exemplo, afina seus algoritmos de classificação rastreando e analisando mais de um trilhão de consultas de pesquisa a cada ano. Acontece que o poder salomônico para responder a todas as perguntas de todos os participantes pode ser forçado de forma bruta com dados suficientes.

    Mas há um problema: a maioria das empresas se limita a “pequenos” dados; em muitos casos, eles possuem apenas algumas dezenas de exemplos dos processos que desejam automatizar usando o ML. Se você está tentando construir um sistema de ML robusto para clientes corporativos, precisa desenvolver novas técnicas para superar essa escassez de dados.

    Duas técnicas em particular – transferir aprendizagem e aprendizagem coletiva – têm se mostrado essenciais na transformação de pequenos dados em big data, permitindo que empresas de médio porte se beneficiem de casos de uso de ML que antes eram reservados apenas para Big Tech. E como apenas 15% das empresas já implantaram IA ou ML, há uma grande oportunidade para essas técnicas transformarem o mundo dos negócios.

    Acima: usando os dados de apenas uma empresa, mesmo os modelos modernos de aprendizado de máquina têm apenas 30% de precisão. Mas, graças à aprendizagem coletiva e transferência de aprendizagem, o Moveworks pode determinar a intenção das solicitações de suporte de TI dos funcionários com mais de 90% de precisão.

    Crédito da imagem: Moveworks

    Do faça você mesmo ao código aberto

    Claro, os dados não são o único pré-requisito para um modelo de aprendizado de máquina de classe mundial – há também a pequena questão de construir esse modelo em primeiro lugar. Dada a escassez de engenheiros de aprendizado de máquina, contratar uma equipe de especialistas para arquitetar um sistema de ML do zero simplesmente não é uma opção para a maioria das organizações. Essa disparidade ajuda a explicar por que uma empresa de tecnologia com bons recursos como o Google se beneficia desproporcionalmente do ML.

    Mas, nos últimos anos, uma série de modelos de ML de código aberto – incluindo o famoso modelo BERT para entender a linguagem, que o Google lançou em 2018 – começaram a mudar o jogo. A complexidade de criar um modelo do calibre do BERT, cuja versão apropriadamente chamada de “grande” tem cerca de 340 milhões de parâmetros, significa que poucas organizações podem sequer considerar o quarterback de tal iniciativa. No entanto, por ser de código aberto, as empresas agora podem ajustar esse manual publicamente disponível para lidar com seus casos de uso específicos.

    Para entender como esses casos de uso podem parecer, considere uma empresa como a Medallia, um cliente do Moveworks. Por si só, o Medallia não possui dados suficientes para construir e treinar um sistema de ML eficaz para um caso de uso interno, como suporte de TI. Mesmo assim, seus pequenos dados contêm um tesouro de insights à espera do ML para desbloqueá-los. E, aproveitando novas técnicas para coletar esses insights, o Medallia se tornou mais eficiente, desde o reconhecimento de quais fluxos de trabalho internos precisam de atenção até a compreensão da linguagem específica da empresa que seus funcionários usam ao solicitar suporte técnico.

    Grande progresso com poucos dados

    Portanto, aqui está a pergunta de um trilhão de dólares: como você pega um modelo de ML de código aberto projetado para resolver um problema específico e aplica esse modelo a um problema distinto na empresa? A resposta começa com transferir aprendizagem, que, sem surpresa, envolve a transferência de conhecimento adquirido de um domínio para um domínio diferente que possui menos dados.

    Por exemplo, tomando um modelo de ML de código aberto como o BERT – projetado para entender a linguagem genérica – e refinando-o nas margens, agora é possível para o ML entender a linguagem única que os funcionários usam para descrever problemas de TI. E a linguagem é apenas o começo, já que apenas começamos a perceber o enorme potencial dos pequenos dados.

    transferir aprendizagem

    Acima: A aprendizagem de transferência aproveita o conhecimento de um domínio relacionado – normalmente um com um maior suprimento de dados de treinamento – para aumentar os pequenos dados de um determinado caso de uso de ML.

    Crédito da imagem: Moveworks

    De maneira mais geral, essa prática de alimentar um modelo de ML com uma seleção muito pequena e muito específica de dados de treinamento é chamada de “aprendizado rápido”, um termo que rapidamente se tornou um dos novos grandes chavões na comunidade de ML. Alguns dos modelos de ML mais poderosos já criados – como o modelo GPT-3 e seus 175 bilhões de parâmetros, ordens de magnitude mais do que o BERT – demonstraram um talento sem precedentes para aprender novas tarefas com apenas alguns exemplos como treinamento .

    Tomando essencialmente toda a internet como seu “domínio tangencial”, o GPT-3 rapidamente se torna proficiente nessas novas tarefas ao construir sobre uma base poderosa de conhecimento, da mesma forma que Albert Einstein não precisaria de muita prática para se tornar um mestre em damas. E embora o GPT-3 não seja de código aberto, a aplicação de técnicas de aprendizado de poucos instantes semelhantes permitirá novos casos de uso de ML na empresa – aqueles para os quais os dados de treinamento são quase inexistentes.

    O poder do coletivo

    Com o aprendizado de transferência e o aprendizado de poucos instantes além de poderosos modelos de código aberto, as empresas comuns podem finalmente comprar ingressos para a arena do aprendizado de máquina. Mas, embora o treinamento de ML com transferência de aprendizagem consuma várias ordens de magnitude a menos de dados, para alcançar um desempenho robusto é necessário dar um passo adiante.

    Essa etapa é aprendizagem coletiva, que entra em ação quando muitas empresas individuais desejam automatizar o mesmo caso de uso. Enquanto cada empresa se limita a pequenos dados, as soluções de IA de terceiros podem usar o aprendizado coletivo para consolidar esses pequenos conjuntos de dados, criando um corpus grande o suficiente para ML sofisticado. No caso de compreensão de linguagem, isso significa abstrair sentenças que são específicas de uma empresa para descobrir as estruturas subjacentes:

    aprendizagem coletiva

    Acima: A aprendizagem coletiva envolve abstrair dados – neste caso, sentenças – com ML para descobrir padrões e estruturas universais.

    Crédito da imagem: Moveworks

    A combinação de aprendizagem por transferência e aprendizagem coletiva, entre outras técnicas, está rapidamente redesenhando os limites do ML empresarial. Por exemplo, reunir dados de vários clientes pode melhorar significativamente a precisão dos modelos projetados para entender a maneira como seus funcionários se comunicam. Muito além da compreensão da linguagem, é claro, estamos testemunhando o surgimento de um novo tipo de local de trabalho – um movido por aprendizado de máquina em pequenos dados.


    Artigos Recentes

    A gigante de logística e aluguel de caminhões Ryder se junta às empresas dando o salto para o capital de risco em 2020

    Embora o lançamento de um fundo de capital de risco de US $ 50 milhões pela empresa de transporte, logística e aluguel de...

    Guia do desafio da quarta temporada da quarta semana, da semana 10: como andar 20.000 metros em um veículo

    É uma nova semana, o que significa que há um novo conjunto de Quinze dias desafios a enfrentar. Para a temporada 4,...

    Fog Computing e seu papel na Internet das coisas

    A computação de névoa se refere a uma estrutura de computação descentralizada. Os recursos, incluindo os dados e aplicativos, são colocados em...

    Como escolher um aspirador de robô

    Um aspirador de pó robô pode tornar sua vida muito mais fácil. Diga adeus ao passar horas limpando sua casa e olá...

    Far Cry 6 é o mais recente jogo de grande sucesso a ser adiado

    Não foi uma boa semana para os fãs de videogames de mundo aberto. Primeiro, o Cyberpunk 2077 foi adiado mais uma vez...

    Artigos Relacionados

    DEIXE UMA RESPOSTA

    Por favor digite seu comentário!
    Por favor, digite seu nome aqui