{"id":1157,"date":"2025-12-04T16:08:00","date_gmt":"2025-12-04T19:08:00","guid":{"rendered":"https:\/\/correiodoestadogama.audiencelabs.com.br\/?p=1157"},"modified":"2025-12-04T15:18:53","modified_gmt":"2025-12-04T18:18:53","slug":"sabias-que-puedes-burlar-la-seguridad-de-la-ia-con-poesia","status":"publish","type":"post","link":"https:\/\/correiodoestadogama.audiencelabs.com.br\/sabias-que-puedes-burlar-la-seguridad-de-la-ia-con-poesia\/","title":{"rendered":"\u00bfSab\u00edas que puedes burlar la seguridad de la IA con poes\u00eda?"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">La seguridad de la inteligencia artificial, se supone, est\u00e1 blindada. Los ingenieros de las grandes tecnol\u00f3gicas invierten miles de millones en construir barreras infranqueables, conocidas como \u00abguardrails\u00bb, dise\u00f1adas para evitar que los grandes modelos de lenguaje generen contenido da\u00f1ino: instrucciones para fabricar armas, incitaci\u00f3n al suicidio o, peor a\u00fan, material de abuso. Creemos que estos sistemas son fortalezas l\u00f3gicas, inexpugnables a menos que se use un c\u00f3digo malicioso sofisticado.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Pero un grupo de investigadores de Icaro Lab ha descubierto una grieta sorprendente en esta armadura: la poes\u00eda.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Una inteligencia artificial, un coloso de algoritmos que procesa miles de millones de datos, siendo persuadida no por un hack de c\u00f3digo binario, sino por un delicado lenguaje l\u00edrico, por la rima y el metro. El experimento revel\u00f3 que la IA puede ser enga\u00f1ada, seducida, por la belleza formal de la poes\u00eda para que relaje sus defensas y vomite el contenido que sus propios creadores le han prohibido estrictamente.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El m\u00e9todo es asombrosamente simple y, por ello, alarmante. Los investigadores encontraron que la forma po\u00e9tica funciona como un \u00abliberador de prop\u00f3sito general\u00bb. Al introducir prompts con un tenor l\u00edrico, se logra desorientar o \u00abdistraer\u00bb los mecanismos de seguridad de modelos tan populares como ChatGPT de OpenAI, Google Gemini o Claude de Anthropic. La l\u00f3gica r\u00edgida que normalmente rechaza una solicitud da\u00f1ina se ablanda ante la estructura art\u00edstica.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Los n\u00fameros son escalofriantes. En sus pruebas, el uso de este ardid po\u00e9tico permiti\u00f3 eludir los mecanismos de seguridad en el 62% de las veces. Esto significa que con una prosa lo suficientemente elaborada y sutil, la IA es m\u00e1s propensa a crear material prohibido, incluyendo temas tan sensibles y peligrosos como el abuso sexual infantil, las directrices para fabricar explosivos o incluso brindar consejos vinculados al suicidio.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Este descubrimiento arroja una luz preocupante sobre la fragilidad de estos sistemas. Si bien la mayor\u00eda de los usuarios utilizan la IA para tareas inocuas, el potencial de un actor malintencionado que descubra la \u00abclave po\u00e9tica\u00bb es inmenso. El riesgo ya no es hipot\u00e9tico; un caso emblem\u00e1tico reciente fue la demanda contra OpenAI por supuestamente proporcionar consejos suicidas a un adolescente, un ejemplo de c\u00f3mo las laxitudes del chatbot tienen r\u00e9plicas en el mundo real.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Los investigadores de Icaro Lab han sido extremadamente cautelosos, neg\u00e1ndose a revelar las instrucciones po\u00e9ticas exactas que utilizaron, argumentando que ser\u00eda \u00abdemasiado peligroso\u00bb ense\u00f1arle a la sociedad c\u00f3mo replicar la t\u00e9cnica. Se limitaron a dar una pista: \u00abProbablemente, es m\u00e1s f\u00e1cil de lo que se cree. Precisamente por eso somos cautelosos\u00bb.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Este ensayo no solo cuestiona la efectividad de las barreras de seguridad de los LLM, sino que tambi\u00e9n nos obliga a reevaluar c\u00f3mo interactuamos con la inteligencia artificial. Nos recuerda que, a pesar de su complejidad matem\u00e1tica, estos sistemas siguen siendo vulnerables a la manipulaci\u00f3n humana. La poes\u00eda, hist\u00f3ricamente el lenguaje del alma y la verdad, se ha convertido, parad\u00f3jicamente, en el lenguaje que desarma la \u00e9tica de las m\u00e1quinas, revelando que la belleza de la palabra puede ser la llave para desatar su lado m\u00e1s oscuro.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La seguridad de la inteligencia artificial, se supone, est\u00e1 blindada. Los ingenieros de las grandes tecnol\u00f3gicas invierten miles de millones en construir barreras infranqueables, conocidas como \u00abguardrails\u00bb, dise\u00f1adas para evitar que los grandes modelos de lenguaje generen contenido da\u00f1ino: instrucciones para fabricar armas, incitaci\u00f3n al suicidio o, peor a\u00fan, material de abuso. Creemos que estos [&hellip;]<\/p>\n","protected":false},"author":4,"featured_media":1158,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"jnews-multi-image_gallery":[],"jnews_single_post":{"format":"standard"},"jnews_primary_category":[],"jnews_social_meta":[],"jnews_post_split":[],"footnotes":""},"categories":[1],"tags":[270,284],"class_list":["post-1157","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-gama","tag-ia","tag-seguridad"],"_links":{"self":[{"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/posts\/1157","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/comments?post=1157"}],"version-history":[{"count":1,"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/posts\/1157\/revisions"}],"predecessor-version":[{"id":1159,"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/posts\/1157\/revisions\/1159"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/media\/1158"}],"wp:attachment":[{"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/media?parent=1157"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/categories?post=1157"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/correiodoestadogama.audiencelabs.com.br\/wp-json\/wp\/v2\/tags?post=1157"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}