Programa fácil pode ajudar a desenvolver modelos simleiros e IA ativos | Mit Story - Mundo Tecnologia: Notícias e Dicas de Tecnologia

Inteligência de rede neural Inteligência usada em aplicativos, como implementação clínica e reconhecimento de fala, desempenhando as funções da complexidade dos dados que requerem processamento. Esta é uma das razões para um profundo aprendizado a comer muita energia.

Melhorando a eficiência dos modelos de IA, os pesquisadores do MIT criam um sistema automatizado que oferece aos engenheiros de aprendizado mais profundos para usar os dois tipos de dados. Isso reduz a quantidade de armazenamento atraente de largura de banda e memória necessária para aprender um equipamento de aprendizado.

Os técnicos existentes podem ser complexos e, geralmente, permitindo que os desenvolvedores usem escassez ou simetria – dois tipos diferentes de reabilitação de dados.

Ao capacitar o engenheiro a formar um algoritmo desde o início das redundâncias ao mesmo tempo, o MIT Research conduz a velocidade dos complementos das 30 vezes.

Como o sistema usa a linguagem de programas de fácil uso, ele pode corrigir muitos algoriths de sistemas. O programa também pode ajudar um cientista que não pode ser um aprendizado profundo, mas deseja melhorar a eficiência dos algoriths da IA que eles usam para processar dados. Além disso, o programa pode ter solicitações de computação científica.

“Durante muito tempo, a captura dos dados requer um grande esforço de iniciativa. Simpósio para codificar e ter um bom desempenho.

Ele é compilado em um escritor de papel Rad Ratel '23, SM '24 e o escritor sênior Sanama Rasing, Ecessecs) e o principal pesquisador (CSAIL).

Para cortar a combinação

No estudo da máquina, as informações são frequentemente expostas e usadas com tantos aspectos diferentes conhecidos como desejos. O tensor é como uma matriz, parte das pequenas quantidades organizadas em dois eixos, linhas e colunas. Mas, diferentemente da matriz de dois tamanhos, o número pode ter muitos tamanhos ou eixos, dificultando a desativação.

Os modelos de aprendizado profundo fazem funções nas colunas que usam duas vezes massagem de matriz e adição – esse processo que as redes neururais aprendem padrões complexos nos dados. O volume digno deve ser feito de muitas estruturas de dados diferentes requerem uma grande quantidade de compactação e potência.

Mas, devido à forma de dados baseados em dados, os engenheiros podem aprimorar a velocidade da rede neural cortando habilidades indesejadas.

Por exemplo, se o título representar dados de revisão do usuário do site de comércio eletrônico, porque nem todos os comentários de usuário revisam todo o produto, a maioria dos preços desse tussor pode ser zero. Esse tipo de diminuição dos dados é chamado de escarsidade. O modelo pode economizar tempo para a integração e operação final aos valores diferentes de zero.

Além disso, às vezes o tensor é simétrico, o que significa que uma alta e metade da estrutura de dados é igual. Nesse caso, o modelo requer trabalho em uma parte, reduzindo a quantidade de compulsória. Esse tipo de redundância de dados é chamado de sincronização.

“Mas quando você tenta capturar essas duas estruturas, a situação se torna muito complexa”, diz Ahrens.

Para facilitar o processo, ele e seus participantes formam uma nova conjunção, que é um programa de computador que traduz o código complexo em um idioma simples que pode ser processado por uma máquina. Seu congregador, chamado System, pode executar bem a computação através das possibilidades de esparsidade e conveniência dos desejos.

Eles iniciaram o processo de construção do sistema observando três principais energia que podem usar para usar a sincronização.

Primeiro, se a liberação do algoritmo for o começo, é necessário apenas inserir uma parte dele. Segundo, se o estômago de tesor inserir, o algoritmo exige apenas uma parte dele. Finalmente, se os efeitos centrais das obras de Tesor forem um simétrico, o algoritmo pode violar habilidades indesejadas.

Um trabalhando

Para usar o sistema, um engenheiro que instala seu sistema e programa com forma automática faz com que seu código nos três tipos de medição. Em seguida, a categoria do segundo sistema faz alterações adicionais para manter os dados de dados diferentes de zero, criando um sistema de esparsidade.

Finalmente, o sistema produz um código para uso.

“Dessa forma, recebemos benefícios de ambos. E algo interessante em simetria, pois seu estômago tem um tamanho excelente, você pode obter mais dinheiro através da integração”, disse Ahrens.

Os investigadores mostram velocidades que têm aproximadamente 30 recursos por geração automaticamente gerada pelo sistema.

Como o sistema é automático, pode ser muito útil em situações em que o cientista deseja processar dados usando o algoritmo.

No futuro, os pesquisadores desejam combinar o sistema nos programas existentes do Tenser Tenser Compiler para criar usuários não utilizados. Além disso, eles gostariam de usá -lo corretamente.

O trabalho é financiado, em parte, com a Intel, a National Science Foundation, a Avanced Research Agency e o Departamento de Energia.

Source link

Você também pode gostar...

Pesquisadores da CMU lançam Pangea-7B: modelos multilíngues totalmente abertos para MLLMs em 39 idiomas

Avaliando o impacto das ferramentas de geração de código (ChatGPT e GitHub Copilot) na educação em programação

Conheça o DrugAgent: uma estrutura multiagente para aprendizado de máquina automatizado na descoberta de medicamentos

Deixe um comentário Cancelar resposta