Avez-vous déjà pensé à quel point il est sauvage que quelque chose d'aussi inoffensif que la poésie puisse briser la sécurité de l'IA ? Oui, des chercheurs viennent de découvrir que des attaquants utilisent littéralement des formats poétiques pour contourner les protocoles de sécurité. Pas de code malveillant, juste des vers et des motifs rythmiques qui, d'une manière ou d'une autre, confondent les garde-fous sur lesquels ces systèmes s'appuient. Cela vous fait vous demander quels autres contournements créatifs se cachent là-bas, à la vue de tous.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
15 J'aime
Récompense
15
5
Reposter
Partager
Commentaire
0/400
DevChive
· Il y a 6h
Eh, maintenant même poetry est devenu une arme, la défense de l’IA, c’est vraiment un tigre de papier.
Voir l'originalRépondre0
ser_we_are_ngmi
· Il y a 6h
Le jailbreak de la poésie est vraiment incroyable, il semble que je devrais apprendre à l'IA quelques poèmes de la dynastie Tang.
Voir l'originalRépondre0
TommyTeacher
· Il y a 6h
Putain, même la poésie peut briser la sécurité de l’IA ? C’est vraiment abusé, il va falloir que ces experts en sécurité retournent à la case départ.
Voir l'originalRépondre0
DeepRabbitHole
· Il y a 6h
La poésie jailbreak est vraiment incroyable, on dirait que la protection de l'IA n'est qu'un tigre en papier.
Voir l'originalRépondre0
GasFeeCrier
· Il y a 6h
Évasion poétique haha, ces ingénieurs en sécurité doivent être tellement embarrassés.
Avez-vous déjà pensé à quel point il est sauvage que quelque chose d'aussi inoffensif que la poésie puisse briser la sécurité de l'IA ? Oui, des chercheurs viennent de découvrir que des attaquants utilisent littéralement des formats poétiques pour contourner les protocoles de sécurité. Pas de code malveillant, juste des vers et des motifs rythmiques qui, d'une manière ou d'une autre, confondent les garde-fous sur lesquels ces systèmes s'appuient. Cela vous fait vous demander quels autres contournements créatifs se cachent là-bas, à la vue de tous.