Defesa de injeção rápida contra ataques cibernéticos LLM
Estudo interessante: “AI-Hacker: injeção rápida como defesa contra ataques cibernéticos por LLM”:
Modelos de linguagem em larga escala (LLMs) estão sendo cada vez mais usados para automatizar ataques cibernéticos, tornando explorações sofisticadas mais acessíveis e escaláveis. Em resposta, propomos uma nova estratégia de segurança concebida para combater ataques cibernéticos conduzidos por LLM. Apresentamos o Mantis, uma estrutura de proteção que utiliza os pontos fortes dos LLMs na tendência de manter pontos de vista opostos para minar atividades maliciosas. Após detectar um ataque cibernético automatizado, as fábricas da Mantis criam cuidadosamente entradas para as respostas do sistema, levando o LLM do invasor a interromper suas operações (defesa passiva) ou comprometer a máquina do invasor (defesa ativa). Ao usar iscas deliberadas para atrair o atacante e usar injeções rápidas do LLM do atacante, o louva-a-deus pode repelir automaticamente o atacante. Em nossos testes, o Mantis alcançou mais de 95% de eficiência contra ataques automatizados executados pelo LLM. Para encorajar mais pesquisas e colaboração, o mantis está disponível como uma ferramenta de código aberto: https URL.
Isto não é uma solução, claro. Mas esse tipo de coisa pode ser parte da solução.
Publicado em 7 de novembro de 2024 às 11h13 • 0 comentários
Foto da barra lateral de Bruce Schneier por Joe MacInnis.