O processo de projeto integrativo em engenharia mecânica geralmente começa com um problema ou objetivo, seguido por uma revisão da literatura, recursos e sistemas disponíveis para resolver o problema. O Laboratório de Design Computação e Engenharia Digital (DeCoDE) do MIT explora os limites do que é possível.
Trabalhando com o MIT-IBM Watson AI Lab, o líder da equipe, o professor assistente ABS Faez Ahmed, e o estudante de pós-graduação Amin Heyrani Nobari no Departamento de Engenharia Mecânica combinam aprendizado de máquina e métodos generativos de IA, modelagem física e princípios de engenharia para enfrentar e projetar desafios e melhorar o projeto de sistemas mecânicos. Um de seus projetos, Comunicaçãoinvestiga métodos de conexão de barras planas e juntas para traçar caminhos curvos. Aqui, Ahmed e Nobari descrevem seu trabalho mais recente.
Pergunta: Como sua equipe pensa em abordar questões de engenharia mecânica de uma perspectiva visual?
Ahmed: A questão que temos pensado é: como a IA generativa pode ser usada em aplicações de engenharia? O maior desafio é incorporar precisão aos modelos de IA que produz. Agora, no trabalho específico que estávamos explorando lá, estamos usando essa ideia de métodos de aprendizagem adversários que vocês observaram, onde estamos aprendendo essa relação com a representação da curva de projeto, ou como é o projeto, e como funciona. .
Isto está intimamente relacionado com o conceito de descoberta automatizada: podemos descobrir novos produtos com algoritmos de IA? Outro comentário sobre o panorama geral: uma das ideias principais, especialmente sobre comunicação, mas mais amplamente sobre IA generativa e grandes modelos de linguagem – todos são a mesma família de modelos que estamos analisando, e a precisão desempenha um papel muito importante . tudo. Portanto, o que aprendemos com estes tipos de modelos, quando os temos, é outro tipo de aprendizagem orientada por dados que é auxiliada por simulações de engenharia e pela incorporação conjunta de design e desempenho – eles também podem ser traduzidos para outros domínios de engenharia. O que estamos mostrando é uma prova de conceito. Então as pessoas podem pegá-lo e projetar navios e aviões, e os problemas de produção de imagens precisas, e assim por diante.
Em termos de coordenação, seu projeto se parece com um conjunto de barras e como elas estão conectadas. A forma como funciona é basicamente a forma como eles escreveriam, e lemos essas apresentações conjuntas. Então, aí está a sua entrada principal – alguém virá e traçará um determinado caminho – e você está tentando criar um caminho que possa rastrear isso. Isso nos permite resolver o problema com muito mais precisão e rapidez, com 28 vezes menos erros (maior precisão) e 20 vezes mais rápido do que os métodos de última geração anteriores.
Pergunta: Conte-me sobre o método de comunicação e como ele se compara a outros métodos semelhantes.
Sem bari: O aprendizado cruzado ocorre entre processos, que são representados como grafos, então, basicamente, cada membro será um nó no grafo e o nó incluirá determinados elementos. As características são a forma, o espaçamento e o tipo de juntas, sejam elas fixas ou livres.
Temos uma estrutura que leva em conta alguns dos fundamentos quando se trata da definição da cinemática da máquina, mas na verdade é uma rede neural de grafos que inclui a incorporação desses gráficos de máquinas. E então, temos outro modelo que toma como entrada essas curvas e cria uma incorporação delas, e conectamos essas duas abordagens diferentes usando aprendizagem cruzada.
Então, essa estrutura de aprendizagem diferente que treinamos é usada para encontrar novos caminhos, mas obviamente também nos preocupamos com a precisão. Além de quaisquer curvas candidatas identificadas, também temos uma etapa de otimização adicional, onde essas curvas identificadas serão otimizadas ainda mais para se aproximarem dessas curvas alvo.
Se você tiver a peça certa para combinar e estiver muito perto de onde precisa estar para chegar à curva alvo que possui, poderá fazer a otimização baseada em gradiente vertical e ajustar a posição das juntas para obtê-la. desempenho muito preciso nele. Esse é um recurso muito importante para trabalharmos.
Estes são exemplos de alfabetos, mas são muito difíceis de conseguir tradicionalmente com os métodos existentes. Outros métodos baseados em aprendizado de máquina muitas vezes nem conseguem fazer esse tipo de coisa porque são treinados apenas em quatro ou seis barras, que são padrões muito pequenos. Mas o que conseguimos mostrar é que mesmo que você tenha um número pequeno de juntas, você pode chegar muito perto dessas curvas.
Antes disso, não sabíamos quais eram os limites das capacidades de design com um único conector. É uma pergunta muito difícil de saber. Você pode realmente escrever a letra M, certo? Ninguém nunca fez isso, e esta máquina é tão complicada e rara que é como encontrar uma agulha num palheiro. Mas desta forma mostramos que é possível.
Estamos procurando usar modelos generativos prontos para uso para gráficos. Em geral, modelos que geram gráficos são muito difíceis de treinar, e muitas vezes não funcionam bem, principalmente quando se trata de misturar variáveis contínuas com uma sensibilidade muito alta ao que será a cinemática real da máquina. Ao mesmo tempo, você tem todas essas diferentes formas de se conectar e se comunicar. Esses modelos simplesmente não conseguem produzir de forma eficaz.
A complexidade do problema, penso eu, é mais óbvia quando se olha como as pessoas lidam com ele de forma eficaz. Por preparação, isso se torna um problema misto e não linear. Usando uma configuração simples de dois níveis ou simplificando o problema, eles basicamente criam uma aproximação de todas as funções, para que possam usar uma configuração cônica mista completa para lidar com o problema. O espaço articular combinado com o espaço contínuo é tão grande que pode atingir até sete juntas. Caso contrário, torna-se muito difícil e leva dois dias para criar um caminho para um alvo específico. Se você fizesse isso completamente, seria muito difícil cobrir toda a área do design. É aqui que você não pode simplesmente investir em aprendizado profundo sem tentar ser um pouco mais inteligente sobre como fazê-lo.
Métodos eficazes de aprendizagem profunda usam aprendizagem por reforço. Eles – dada uma curva alvo – começam a construir esses caminhos aleatoriamente, basicamente um tipo de otimização Monte Carlo. A medição disso compara diretamente a curva seguida pela máquina e as curvas alvo inseridas no modelo, e mostra que nosso modelo tem um desempenho 28 vezes melhor que isso. São 75 segundos em nosso método, e o método de reforço baseado na aprendizagem leva 45 minutos. O método de atualização, você usa por mais de 24 horas e não combina.
Acho que chegamos ao ponto em que temos uma forte prova de conceito para vincular processos. É um problema tão complexo que podemos ver que o desenvolvimento padrão e o aprendizado profundo padrão por si só não são suficientes.
Pergunta: Qual é o panorama geral por trás da necessidade de desenvolver técnicas semelhantes às da comunicação que possibilitem o futuro do design colaborativo humano-IA?
Ahmed: O mais óbvio é o projeto de máquinas e sistemas de máquinas, que já mostramos. Dito isto, penso que uma contribuição importante deste trabalho é que é um lugar transparente e contínuo para aprendermos. Então, se você pensar nas conexões que existem e como elas estão conectadas entre si, esse é um espaço diferente. Você está conectado ou não: 0 e 1, mas onde cada nó está, é um espaço contínuo que pode variar – você pode estar em qualquer lugar do espaço. Estudar essas áreas diversas e contínuas é um problema muito difícil. A maior parte do aprendizado de máquina que vemos, como na visão computacional, é apenas contínuo, mesmo que a linguagem seja muito diferente. Ao mostrar este sistema claro e contínuo, penso que a ideia principal inclui muitas aplicações de engenharia, desde metamateriais a redes complexas, a outros tipos de estruturas, e assim por diante.
Há etapas nas quais pensamos imediatamente, e a questão natural gira em torno de sistemas mecânicos mais complexos e mais física, como começar a adicionar diferentes tipos de comportamento elástico. Depois, você também pode pensar em diferentes tipos de peças. Também estamos pensando em como a precisão em grandes modelos de linguagem pode ser incorporada, e alguns dos aprendizados serão transferidos para lá. Estamos pensando em tornar esses modelos produtivos. Atualmente, de certa forma, eles encontram os métodos e os desenvolvem a partir do conjunto de dados, enquanto os modelos generativos irão gerar esses métodos. Também verificamos a última leitura, onde nenhuma otimização é necessária.
Sem bari: Existem diversas áreas da engenharia mecânica onde são utilizados, e há aplicações muito comuns deste tipo de síntese cinemática inversa, onde esta pode ser útil. Alguns dos que vêm à mente, por exemplo, estão em sistemas de suspensão de automóveis, onde você deseja uma trajetória de movimento específica para todo o sistema de suspensão. Normalmente, eles modelam isso em 2D com modelos esquemáticos da estrutura geral.
Penso que o próximo passo, e o que acabará por ser mais útil, é mostrar o mesmo quadro ou quadro semelhante para outros problemas complexos que envolvem valores integrais e contínuos.
Esses problemas incluem uma das coisas que tenho observado: métodos compatíveis. Por exemplo, se você tiver uma máquina contínua – em vez dessa conexão fixa – sólida, você terá uma distribuição de materiais e movimentos, e uma parte do material desabilita tudo para lhe dar um tipo diferente de movimento.
Nos métodos compatíveis, existem várias áreas de utilização, por vezes nas máquinas de precisão das máquinas de reparação, onde se pretende que uma determinada peça seja mantida no lugar, utilizando uma máquina de reparação, que o possa fazer de forma consistente e com elevada precisão. Se você pudesse automatizar muito isso com esse tipo de estrutura, seria muito útil.
Todos esses são problemas difíceis que envolvem variáveis de projeto discretas e variáveis de projeto contínuas. Penso que estamos muito perto disso e, em última análise, essa será a fase final.
Este trabalho foi apoiado, em parte, pelo MIT-IBM Watson AI Lab.