Projetar unidades de processamento sensorial neuromórficas (NSPUs) baseadas em Redes Neurais Temporais (TNNs) é uma tarefa muito desafiadora devido à dependência de processos de desenvolvimento de hardware manuais e trabalhosos. As TNNs foram identificadas como muito promissoras para aplicações de IA de ponta em tempo real, principalmente porque são energeticamente eficientes e bioinspiradas. No entanto, os métodos disponíveis carecem de automação e não são muito acessíveis. Como resultado, o processo de design torna-se complexo, demorado e requer conhecimento especializado. É através da superação desses desafios que se pode desbloquear todo o potencial do TNN para processamento e processamento eficiente de sinais sensoriais.
Os métodos atuais de desenvolvimento de TNN são fluxos de trabalho separados, já que a simulação de software e os projetos de hardware são tratados separadamente. Desenvolvimentos como as bibliotecas ASAP7 e TN7 tornaram certos aspectos do hardware mais eficientes, mas permaneceram ferramentas proprietárias que exigiam conhecimento significativo. O isolamento do processo limita a usabilidade, evita testes fáceis de configurações de projeto com maior sobrecarga computacional e não pode ser usado para prototipagem rápida para fins de implantação em larga escala ou específicos de aplicativos.
Pesquisadores da Carnegie Mellon University apresentam o TNNGen, uma estrutura compacta e automatizada para projetar NSPUs baseadas em TNN. A inovação reside na integração de simulação baseada em software e produção de hardware em um fluxo de trabalho simplificado. Inclui um simulador baseado em PyTorch, modelo de dinâmica de tempo de pico e avaliação de métricas específicas de aplicativos, e um gerador de hardware que automatiza a geração de RTL e o design de arquitetura usando PyVerilog. Através do uso de macros TNN7 personalizadas e da integração de várias bibliotecas, esta estrutura apresenta melhorias significativas na velocidade e na física da simulação. Além disso, seus recursos preditivos facilitam a previsão precisa de métricas de silício, reduzindo assim a dependência de ferramentas EDA computacionalmente exigentes.
O TNGen está organizado em torno de dois componentes principais. Um simulador funcional, construído em PyTorch, permite configurações flexíveis de TNN, permitindo testes rápidos de vários modelos arquitetônicos. Possui aceleração de GPU e um modelo preciso de tempo de pico, garantindo assim alta velocidade e precisão de simulação. O gerador de hardware converte modelos PyTorch em RTL avançado e arquiteturas virtuais. Usando bibliotecas como TNN7 e scripts TCL personalizados, ele automatiza processos de zoneamento e roteamento, ao mesmo tempo que é compatível com vários nós de tecnologia, como FreePDK45 e ASAP7.
O TNGen alcança excelente desempenho tanto em precisão de montagem quanto em eficiência de hardware. O design TNN para funções de agrupamento de séries temporais apresenta desempenho competitivo com as melhores técnicas de aprendizado profundo, ao mesmo tempo que reduz significativamente o consumo de recursos computacionais. Este método traz melhorias na eficiência energética, conseguindo uma redução no espaço morto e no vazamento de energia em comparação aos métodos convencionais. Além disso, o tempo de execução do projeto é significativamente reduzido, especialmente para projetos grandes, que se beneficiam enormemente de fluxos de trabalho otimizados. Além disso, a abrangente ferramenta de previsão fornece estimativas precisas dos parâmetros de hardware, permitindo que os pesquisadores avaliem o desempenho do projeto sem a necessidade de se envolver em processos físicos de hardware. Tomados em conjunto, estes resultados posicionam o TNGen como um método eficaz para reverter e acelerar a criação de sistemas neuromórficos energeticamente eficientes.
TNGen é o próximo passo no desenvolvimento totalmente automatizado de NSPUs baseadas em TNN, combinando simulação e hardware de produção em uma estrutura acessível e eficiente. A abordagem abordou os principais desafios no processo de design manual e tornou a ferramenta mais escalonável e utilizável para aplicações de IA de ponta. O trabalho futuro envolverá a extensão das suas capacidades para o suporte de arquitecturas TNN complexas e uma gama muito mais ampla de aplicações para se tornar um facilitador valioso da computação neuromórfica sustentável.
Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 60k + ML.
🚨 Tendências: LG AI Research Release EXAONE 3.5: Modelos de três níveis de IA bilíngue de código aberto oferecem seguimento de comando incomparável e insights profundos de conteúdo Liderança global em excelência em IA generativa….
Aswin AK é consultor da MarkTechPost. Ele está cursando seu diploma duplo no Instituto Indiano de Tecnologia, Kharagpur. Ele é apaixonado por ciência de dados e aprendizado de máquina, o que traz consigo uma sólida formação acadêmica e experiência prática na solução de desafios de domínio da vida real.
🧵🧵 [Download] Avaliação do relatório de trauma do modelo de linguagem principal (estendido)