Alex Garcia lançou uma grande atualização para sqlite-vec, uma extensão SQLite que permite pesquisas vetoriais. A versão mais recente, 0.1.6, apresenta vários novos recursos, incluindo colunas de metadados, partições e colunas auxiliares. Esses recursos irão melhorar a eficiência e eficácia da pesquisa vetorial, tornando a extensão mais versátil e útil em vários casos de uso. …
Melhorando a saúde, um programa de aprendizado de máquina por vez | Notícias do MIT
Atraída por videogames e quebra-cabeças quando criança, Marzyeh Ghassemi também ficou fascinada pela vida desde muito jovem. Felizmente, ele encontrou uma maneira de combinar esses dois interesses. “Embora eu tivesse pensado em uma carreira na área da saúde, a atração da ciência da computação e da engenharia era forte”, disse Ghassemi, professor associado do Departamento …
Descobrindo a dinâmica crítica do tamanho do lote: como os dados e o dimensionamento do modelo contribuem para o treinamento de um modelo linguístico em grande escala com novas técnicas de otimização
O treinamento de grandes modelos concentra-se em melhorar a eficiência e robustez das redes neurais, especialmente para pré-treinamento de modelos de linguagem com bilhões de parâmetros. A otimização envolve equilibrar recursos de computação, consistência e precisão dos dados. Conseguir isso requer uma compreensão clara das principais métricas, como o tamanho crítico do cluster (CBS), que …
NVIDIA AI revela Fugatto: um modelo de som de 2,5 bilhões de parâmetros que gera música, voz e áudio a partir de entrada de texto e áudio
Criar, editar e modificar músicas e sons apresenta desafios técnicos e criativos. Os modelos atuais de IA muitas vezes lutam com flexibilidade, concentram-se em pequenas tarefas ou não têm capacidade de integração eficaz. Isto limita a produção assistida por IA e dificulta a flexibilidade criativa. Para que a IA desempenhe um papel na produção musical …
Neural Magic Release 2:4 Sparse Llama 3.1 8B: Modelos pequenos para design de GPU ativo
O rápido crescimento dos tamanhos dos modelos de IA trouxe enormes desafios computacionais e ambientais. Os modelos de aprendizagem profunda, especialmente os modelos de linguagem, cresceram significativamente nos últimos anos, exigindo mais recursos para treinamento e implantação. Esta procura crescente não só aumenta os custos de infraestrutura, mas também contribui para o aumento das emissões …
Nova ferramenta de IA produz imagens de satélite realistas de futuras inundações | Notícias do MIT
Visualizar os efeitos potenciais de um furacão nas casas das pessoas antes que ele atinja pode ajudar os residentes a se prepararem e a decidirem se devem evacuar. Cientistas do MIT desenvolveram um método que gera imagens de satélite do futuro para mostrar como a região pode lidar com um potencial evento de inundação. O …
SemiKong: um modelo de código aberto para o processo de fabricação de semicondutores
Os semicondutores são essenciais para alimentar uma variedade de dispositivos eletrônicos e impulsionar o desenvolvimento nos setores de telecomunicações, automotivo, saúde, energia renovável e IoT. Na fabricação e design de semicondutores, duas fases principais, FEOL e BEOL, apresentam desafios únicos. Os LLMs são treinados em grandes quantidades de dados textuais usando técnicas de aprendizagem supervisionada …
RhoFold +: uma estrutura de aprendizado profundo para previsão precisa de estrutura 3D de RNA a partir de sequência
A previsão de estruturas 3D de RNA é importante para a compreensão de suas funções biológicas, melhorando a descoberta de medicamentos direcionados ao RNA e projetando aplicações de biologia sintética. No entanto, a variabilidade estrutural do RNA e a disponibilidade limitada de dados resolvidos experimentalmente representam desafios. Apesar da importância do RNA na regulação genética, …
Medições de aprendizagem cíclica em visão computacional
Introdução O treinamento de modelos de visão computacional requer um ajuste preciso da taxa de aprendizagem para equilibrar velocidade e precisão. Os cronogramas de Taxa de Aprendizagem Cíclica (CLR) fornecem um mecanismo flexível, alternando entre valores pequenos e grandes para ajudar os modelos a aprender com mais eficiência, evitar mínimos locais e generalizar melhor. Este …
Insight-V: potencializando modelos multitipos com análise escalonável de cadeia longa
A capacidade dos modelos linguísticos multimodais de grande escala (MLLMs) de permitir raciocínios complexos de longo alcance envolvendo texto e visão levanta uma barreira ainda maior no campo da inteligência artificial. Embora as tarefas de raciocínio baseadas em texto estejam sendo gradualmente desenvolvidas, as tarefas multimodais acrescentam desafios adicionais com base na falta de conjuntos …