Refinando a orientação sem classificador (CFG): uma orientação óptica adaptativa para produção de imagens de alta qualidade sem excesso de preenchimento
Inteligência artificial

Refinando a orientação sem classificador (CFG): uma orientação óptica adaptativa para produção de imagens de alta qualidade sem excesso de preenchimento


O Classifier-Free Guiding, ou CFG, é um fator importante para melhorar a qualidade da reprodução da imagem e garantir que a saída corresponda às condições de entrada dos modelos de distribuição. Freqüentemente, é necessária uma grande diretividade ao usar modelos de difusão para melhorar a qualidade da imagem e direcionar os dados de saída e entrada gerados. Usar uma escala de orientação mais alta tem a desvantagem de introduzir artefatos artificiais e cores supersaturadas nas imagens de saída, o que diminui a qualidade geral.

Para superar este problema, os investigadores reexaminaram o desempenho do CFG e sugeriram modificações para melhorar a sua eficácia. A ideia principal do método é dividir o termo de atualização do CFG em duas partes, uma parte ortogonal e uma parte correspondente à previsão do modelo. Eles descobriram que enquanto o componente ortogonal melhora a qualidade da imagem ao revelar detalhes, o componente paralelo é mais propenso a preenchimento excessivo e artefatos não naturais.

Com base nesta descoberta, desenvolveram um plano para reduzir a influência do mesmo componente. O modelo ainda pode fornecer imagens excelentes sem o indesejável efeito colateral de sobrecarga, reduzindo o peso da palavra correspondente. Com o maior controle sobre a reprodução da imagem possibilitado por esta mudança, escalas direcionais mais altas podem ser usadas sem sacrificar um resultado realista e bem equilibrado.

Além disso, os pesquisadores encontraram uma conexão entre os conceitos de subida gradiente, o método preferido de otimização, e como funciona o CFG. Eles encontraram um método único para redimensionar e o processo de atualização da lei CFG com base nesta constatação. Embora o processo dinâmico, comparado aos métodos de reparo dinâmico, melhore a eficiência do processo de revisão ao levar em conta o impacto das etapas anteriores, reduzindo novamente os recursos para controlar o tamanho das atualizações durante a etapa de amostragem, garante a estabilidade.

As vantagens do CFG ainda estão presentes no novo método, a direção proporcional proporcional (APG), que melhora a qualidade da imagem e se adapta às condições de instalação. Contudo, uma grande vantagem do APG é que ele permite o uso de escalas de orientação mais altas sem se preocupar com supersaturação ou artefatos não naturais. O APG é uma alternativa viável para melhores modelos de distribuição, pois é muito mais simples de usar e praticamente elimina a complexidade computacional adicional durante o processo de amostragem.

Os pesquisadores demonstraram, por meio de um conjunto de experimentos, que o APG funciona de forma eficaz com uma variedade de modelos e amostras de distribuição condicional. Os principais indicadores de desempenho, como distância inicial de Fréchet (FID), recall e pontuações de saturação, foram todos melhorados pelo APG, mantendo um nível de precisão comparável ao CFG convencional. Por causa disso, o APG é uma solução plug-and-play melhor e mais flexível que produz imagens de alta qualidade para modelos de transmissão eficientes e com menos compensações.


Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso Mais de 50k ML SubReddit

[Upcoming Event- Oct 17 202] RetrieveX – Conferência de recuperação de dados GenAI (promovida)


Tanya Malhotra está em seu último ano na Universidade de Estudos de Petróleo e Energia, Dehradun, cursando BTech em Engenharia de Ciência da Computação com especialização em Inteligência Artificial e Aprendizado de Máquina.
Ele é um entusiasta de Data Science com forte pensamento analítico e crítico e grande interesse em adquirir novas habilidades, liderar equipes e gerenciar o trabalho de maneira organizada.





Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *