CodeMaker AI Avanço no Desenvolvimento de Software: Alcança 91% de Precisão na Recriação de 90.000 Linhas de Código, Estabelece Nova Referência para Geração de Código Orientada por IA e Modelagem Afinada
Inteligência artificial

CodeMaker AI Avanço no Desenvolvimento de Software: Alcança 91% de Precisão na Recriação de 90.000 Linhas de Código, Estabelece Nova Referência para Geração de Código Orientada por IA e Modelagem Afinada


Na era das indústrias transformadoras de IA, IA do CodeMaker alcançou um marco histórico ao recriar automaticamente uma biblioteca de software de 90.000 linhas com uma surpreendente semelhança de 91% com a base de código original. Este avanço marca uma grande mudança na forma como a IA pode ser usada no desenvolvimento de software, demonstrando o potencial para reduzir os esforços de codificação manual e acelerar significativamente os tempos de desenvolvimento. EU IA do CodeMaker ele é ajustado para compreender e gerar estruturas de código complexas, processa mais de 3.200 arquivos e reproduz código em menos de duas horas. Usando técnicas avançadas de aprendizado de máquina, IA do CodeMaker demonstraram que a geração de código em grande escala, antes difícil para engenheiros humanos, agora pode ser alcançada com precisão, velocidade e economia. As implicações deste desenvolvimento vão além da simples geração de código, pois representa uma nova fronteira no papel da IA ​​na automatização e dimensionamento de tarefas complexas no ambiente de engenharia de software.

CodeMaker AI: uma experiência

A essência de IA do CodeMakerO experimento envolveu o ajuste fino do modelo de aprendizado de máquina diretamente na base de código, permitindo que a IA gerasse código automaticamente. O ajuste fino refere-se a pegar um modelo previamente treinado e treiná-lo em um conjunto de dados específico para que ele se adapte a uma tarefa específica. Neste projeto, a IA é ajustada para uma base de código de produção completa, permitindo gerar código que esteja em conformidade com estilos de codificação, espaços de domínio e arquitetura específicos.

O código recriado foi publicado no GitHub para escrutínio público, e estimativas baseadas no modelo COCOMO sugerem que recriar o código manualmente levaria cerca de 25 anos de tempo de desenvolvedor. Esse forte contraste ressalta a eficiência que a IA traz para o desenvolvimento de software.

Processo de ajuste fino

O processo de otimização envolveu o treinamento de um modelo de IA em 129 milhões de tokens da base de código, que levou 11 horas e 44 minutos por US$ 1.949,75. O modelo é então usado para recriar o código excluído no diretório `src/main/java` usando IA do CodeMakerRecurso de geração de código em lote. O comando usado nesta tarefa foi:

—bash
codemaker generate code --model user-model **/src/main/**/*.java

Este processo de produção em massa foi concluído em 1 hora e 42 minutos, demonstrando a eficiência do IA do CodeMaker em grandes atividades de geração de código.

Comparação e medição de código

Para verificar a precisão do código gerado por IA, IA do CodeMaker duas métricas principais são usadas: taxa de erro e taxa de similaridade. A taxa de erro foi definida como a distância de Levenshtein entre os arquivos originais e gerados, que mede a distância entre os dois arquivos. O grau de similaridade foi calculado da seguinte forma:

—Python
similarity_rate = 1 - (dist(a, b) / max(len(a), len(b)))

Essa métrica respondeu à questão de quão semelhantes dois arquivos eram, com média dos resultados de todos os arquivos do conjunto de dados. Dois modelos foram utilizados para comparação: o modelo de parâmetro base 7B e o modelo de parâmetro ajustado 7B. Os resultados foram os seguintes:

O modelo ajustado teve melhor desempenho que o modelo de linha de base, reduzindo a taxa de erro e aumentando a similaridade. Isto destaca a importância da otimização específica de tarefas de modelos de IA no desenvolvimento de software.

Impactos da IA ​​no desenvolvimento de software

Resultados de IA do CodeMakero sucesso vai além deste teste. À medida que a IA continua a evoluir, abre oportunidades para automatizar a geração de código e outros aspectos do desenvolvimento de software, como testes, documentação e até depuração.

Ciclos de desenvolvimento acelerado

Um dos benefícios imediatos do uso de IA é como IA do CodeMaker no desenvolvimento de software a aceleração dos ciclos de desenvolvimento. Ao automatizar a codificação, os desenvolvedores podem se concentrar mais em tarefas de alto nível, como arquitetura do sistema, design e solução de problemas. Isso pode levar a um desenvolvimento de produtos mais rápido e a um menor tempo de colocação no mercado de soluções de software.

Eficácia de custos

No teste, IA do CodeMaker gerou 90.000 linhas de código em pouco mais de uma hora, por uma fração do custo e do tempo exigidos de desenvolvedores humanos. A economia de tempo e custo da IA ​​pode ser uma virada de jogo para empresas que buscam reduzir custos de desenvolvimento e, ao mesmo tempo, manter código de alta qualidade.

Moldando o papel dos engenheiros

À medida que ferramentas de IA como o CodeMaker se tornam mais sofisticadas, o papel dos desenvolvedores de software pode mudar. Em vez de se concentrar em escrever código do zero, os desenvolvedores podem passar mais tempo supervisionando o código gerado por IA, ajustando modelos para tarefas específicas e enfrentando desafios de design de alto nível. O futuro do desenvolvimento de software pode ser um esforço colaborativo entre a criatividade humana e a eficiência das máquinas.

Regeneração: Desafios e Sucessos

A reprodutibilidade é uma preocupação fundamental em software gerado por IA, e IA do CodeMaker os testes fornecem insights valiosos sobre os desafios e sucessos da refatoração de código.

Estimativas de erro e ajuste fino do modelo

Como pode ser visto na comparação entre modelos de linha de base e modelos ajustados, o ajuste fino é essencial para melhorar a precisão e a consistência do código gerado por IA. O modelo ajustado alcançou uma convergência significativa, mas não conseguiu reproduzir bem o código original. Isto levanta preocupações sobre as limitações dos atuais modelos de IA na replicação completa de códigos complexos.

Ambiguidade de código

Um dos desafios da reprodutibilidade é a ambiguidade inerente à codificação. O código nem sempre é um arranjo de operações um-para-um; Em geral, existem muitas maneiras de fazer o mesmo trabalho. Isso pode dificultar que os modelos de IA determinem a versão “correta” do código sem mais contexto.

Por exemplo, considere o seguinte trecho de código:

—Java
public MockitoException(String message) {
    super(message);
    unfilteredStackTrace = getStackTrace();
    ConditionalStackTraceFilter filter = new ConditionalStackTraceFilter();
    filter.filter(this);
}

Após a refatoração, o código pode ficar assim:

—Java
public MockitoException(String message) {
       super(message);      
       filterStackTrace();
}

Se o modelo de IA compreender a intenção por trás do código original, ele poderá reproduzir uma versão refatorada. Neste caso, porém, surge a ambiguidade porque a IA não consegue determinar o raciocínio por trás da simplificação do código.

O papel do ajuste fino

Apesar destes desafios, a otimização ainda é a melhor solução para melhorar a reprodutibilidade do código gerado por IA. Modelos de treinamento em bases de código específicas podem aumentar a precisão e a validade do código gerado, embora possam ser necessárias iterações completas.

Direções futuras

Sucesso de IA do CodeMaker mostra que a IA pode desempenhar um papel importante no desenvolvimento de software, mas também destaca áreas para mais investigação e desenvolvimento.

Especialização em vez de generalização

Uma conclusão importante deste experimento é que a especialização é mais eficiente do que a generalização em termos de código gerado por IA. Modelos de treinamento para bases de código específicas, em vez de tentar generalizar entre linguagens de programação e estilos de codificação, produzem melhores resultados. As bases de código são um exemplo de dados com baixa normalidade. Esta observação pode levar ao desenvolvimento de modelos especiais de IA projetados para tarefas muito pequenas para obter resultados de alta precisão.

Treinamento Contínuo e Upskilling

Outra consideração importante é o desvio de informações, que ocorre quando a base de código muda. Como o modelo de IA é treinado em uma versão estática do código, ele pode não funcionar bem à medida que a base de código muda. Isto sugere que os modelos de IA devem ser continuamente treinados para acompanhar as atualizações e modificações do código. A frequência do retreinamento dependerá da taxa de mudança na base de código e da taxa de erro aceitável no código gerado pela IA.

Rumo à AGI na codificação

Enquanto IA do CodeMaker representa um importante passo em frente, pois atingir o objetivo geral da IA ​​no desenvolvimento de software ainda não atingiu o seu objetivo. A codificação requer habilidades de geração de código e resolução de problemas que vão além das capacidades de IA. No entanto, os utilizadores poderão ver mais melhorias nesta área à medida que os modelos de IA se tornam mais sofisticados e melhores no tratamento de tarefas complexas.

Medindo Atividades

Com mais funcionalidades de modelagem, é possível estimar o custo e o tempo necessários para processar até mesmo a maior base de código-fonte aberto, como o kernel Linux. A reconstrução completa de 35,8 milhões de linhas de código custaria cerca de US$ 70.000 e levaria cerca de 7 dias. Devido aos avanços em hardware e software, espera-se que tanto o custo quanto o tempo melhorem com o tempo.

A conclusão

IA do CodeMakerA capacidade de recriar 90.000 linhas de código com 91% de similaridade é um marco no uso da IA ​​no desenvolvimento de software. Ao ajustar modelos de IA para códigos específicos, IA do CodeMaker mostrou que a IA pode acelerar significativamente os ciclos de desenvolvimento, reduzir custos e melhorar a eficiência. No entanto, ainda existem desafios como a reprodutibilidade, a ambiguidade do código e a abstração de informações, e são necessárias mais pesquisas para abordar essas questões. EU IA do CodeMaker A equipe disponibilizou toda a base de código recriada para visualização pública GitHubincentiva os desenvolvedores a testar e analisar o código gerado. Esta abordagem de acesso aberto permite ao público compreender melhor as capacidades e limitações da IA. Desenvolvedores interessados ​​em aprender mais sobre IA do CodeMakerprojetos, modelos de ajuste fino ou soluções dinâmicas podem visitá-los site oficial para obter informações detalhadas e atualizações.


Fontes



Graças a IA do CodeMaker equipe de liderança inovadora/Recursos para este artigo. IA do CodeMaker apoiou e patrocinou este conteúdo/artigo.


Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial em benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que parecem tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre o público.

⏩ ⏩ WEBINAR GRATUITO DE IA: ‘Vídeo SAM 2: Como sintonizar seus dados’ (quarta-feira, 25 de setembro, 4h00 – 4h45 EST)



Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *