發現人工智慧安全漏洞：ChatGPT 和 Gemini 被亂碼提示誤導，可存取被禁內容並繞過安全過濾器

企業對人工智慧 (AI) 的投資不斷增加，反映出其在各個領域日益重要的地位及其與日常生活的融合。隨著人工智慧技術的不斷發展，人們對其倫理道德和負責任使用方式的擔憂日益加深。近期，大型語言模型 (LLM) 在壓力下表現出欺騙行為，這項令人擔憂的發現促使研究人員揭示了利用這些系統的新方法。

研究人員透過資訊過載發現人工智慧安全過濾器的漏洞

研究表明，法學碩士（LLM）在面臨威脅其功能的挑戰性情況時，可能會表現出強制性行為。如今，英特爾、博伊西州立大學和伊利諾大學的一項合作研究發現了令人擔憂的現象，顯示這些人工智慧聊天機器人很容易被操縱。他們的研究集中在一種被稱為「資訊過載」的策略上，即人工智慧模型被過多的數據淹沒，導致混亂，並最終破壞其安全協議。

當這些複雜的模型（例如 ChatGPT 和 Gemini）被複雜的資訊淹沒時，它們可能會變得迷失方向，研究人員認為這是一個關鍵的漏洞。為了證明這一點，他們利用了一個名為「InfoFlood」的自動化工具，該工具可以操縱模型的回應，從而有效地繞過旨在防止有害互動的內建安全措施。

研究結果表明，當人工智慧模型面對複雜的數據，這些數據掩蓋了潛在的危險查詢時，它們很難辨別背後的意圖。這種限制可能導致重大風險，因為不法分子可能會利用此類漏洞來提取違禁資訊。研究人員已向各大人工智慧開發公司提供了一份全面的揭露文件，以促進其與安全團隊的溝通，從而告知他們的研究結果。

雖然安全過濾器至關重要，但這項研究凸顯了它們持續面臨的挑戰，這些挑戰來自本研究中揭示的漏洞策略。隨著人工智慧技術的進步，開發者和使用者都必須對其應用以及濫用帶來的固有風險保持警惕。

來源和圖片