A programação de Novel Viewing teve um desenvolvimento significativo recentemente, com a nerf) sendo pioneira em técnicas de resistência 3D com renderização neural. Embora a nerf tenha introduzido novas maneiras de reconstruir cenas acumulando valores RGB de feixes de amostra usando preyptrons multicamadas (MLPS), ela enfrenta grandes desafios de inclusão. A extensa amostragem de pontos de raio e os grandes volumes da rede neural criaram gargalos críticos que afetam o desempenho e o desempenho. Além disso, as dificuldades das políticas para produzir visualizações visuais a partir de imagens de entrada limitadas continuam a impor importantes barreiras técnicas, à procura de métodos mais fáceis de utilizar e mais simples para a reconstrução e interpretação 3D.
Os esforços de pesquisa existentes para responder aos desafios da nova visualização concentram-se em dois mecanismos principais de deslocamento neural que fornecem contaminação. Primeiro, as técnicas de poluição (nerf) surgiram com dicas visuais baseadas em grade e técnicas de minimização de parâmetros. Esses métodos incluem fast-ngp, tensorf, K-farms e DVGO, que tentaram melhorar a eficiência fazendo representações claras. As estratégias de salto são amplamente divididas em abordagens baseadas em valor e abordagens baseadas em estrutura que surgem da abordagem das restrições de engajamento. Métodos quantitativos como poda, coodebooks, potência e problemas de ajuste visam reduzir os cálculos de parâmetros e distribuir a construção do modelo.
Pesquisadores da Manash University e da Shanghai Jiao Tong University propuseram o HAC++, uma nova estrutura de compressão para 3D Gaussian Splatting (3DGS). O método proposto explora o relacionamento entre âncoras não estruturadas e uma grade hash estruturada, utilizando informações que correspondem ao modelo de conteúdo. Ao capturar o relacionamento intra-âncora e introduzir o módulo Adatilization para troca, o HAC++ visa reduzir significativamente os requisitos de armazenamento das representações gaussianas 3D, mantendo ao mesmo tempo altas capacidades de renderização. Também representa um avanço significativo na abordagem dos desafios computacionais e de armazenamento inerentes às atuais técnicas de síntese do Novel View.
A arquitetura HAC++ é construída na estrutura do scaffold-GS e inclui três componentes principais: Hash-Grid apart context (HAC) O módulo Hash-Grid Aside apresenta uma grade HASH estruturada que pode ser consultada em qualquer ponto de ancoragem para encontrar o recurso de hash vinculado. O modelo de conteúdo intra-âncora procura redundâncias internas de âncora, fornecendo informações que ajudam a melhorar a precisão da previsão. O módulo dinâmico adaptativo incorpora âncoras e gaussianas não abertas, incorporando um processo de suavização diretamente na equação de movimento. A arquitetura combina esses componentes para obter uma compressão completa e eficaz das representações gaussianas 3D.
Resultados experimentais mostram o notável desempenho do HAC++ na compressão gaussiana 3D. Ele alcança uma redução de tamanho sem precedentes, excedendo 100 vezes em comparação com o vanilla 3dgs para todos os múltiplos conjuntos de dados, mantendo e melhorando a fidelidade da imagem. Comparado ao modelo BASE SCAFFOLD-GS, o HAC++ oferece uma redução de tamanho de 20 vezes com métricas de desempenho aprimoradas. Enquanto outras abordagens como SOG e conteturgs introduzem modelos de conteúdo, o HAC++ sai lutando para usar modelagem complexa e técnicas de medição adaptativas. Além disso, seu fluxo de bits contém elementos que são inseridos cuidadosamente, com atributos de âncora inseridos por meio de conclusão aritmética, que representa o último elemento principal.
Neste artigo, os pesquisadores apresentam o HAC ++, uma nova abordagem para enfrentar o desafio crítico dos requisitos de armazenamento em apresentações 3D GlausTing. Ao examinar a relação entre gaussianos não estruturados e hashes estruturados, o HAC++ introduz um novo método de compressão que utiliza uma abordagem virtual para obter desempenho de última geração. A extensa validação experimental destaca a eficácia deste método, permitindo a aplicação de 3D Gaussian Splatting a grandes imagens espaciais. Embora reconheça limitações, como aumento do tempo de treinamento e medição de relacionamentos âncora
Confira Página e artigo do GitHub. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Meio teimoso então junte-se ao nosso Estação Telegráfica e LinkedIn Gro assunto. Não se esqueça de se juntar ao nosso Subreddit de 70 mil + ml.
🚨 [Recommended Read] Nebius AI Studio está se expandindo com modelos de visão, novos modelos de linguagem, incorporação e lora (Criado)
Sajjad Ansari é aluno do último ano do IIT Kharagpur. Como um entusiasta da tecnologia, você passa para aplicações práticas de IA focadas na compreensão do impacto das tecnologias de IA e seus impactos no mundo real. Seu objetivo é explicar conceitos complexos de IA de uma forma clara e acessível.
📄 Conheça 'elevação': ferramenta independente de gerenciamento de projetos (patrocinada)