訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
魔鬼藏在細節裡,揪出DeepSeek廬山真面目
獲取產業訊息零時差!立即訂閱電電公會電子報。

來自中國大陸的DeepSeek自問世以來就風波不斷,除了被指控走私高階AI運算晶片、疑似盜取現有ChatGPT資料模型,來達成降低成本的奇效外,還有一系列的資安、敏感詞等相關爭議;DeepSeek的隱憂不止於此,除了將別人的現有資料挪來當常自己的以外,還有可能會藉此變異出其他千奇百怪的玩意兒,也遠遠超出正常、合理使用的範圍,因此DeepSeek讓全世界不得不謹慎以對,藉由了解其潛在不當濫用來做好因應對策、化險為夷。

【技術發展背景】

Deepseek被爆料出衍生自GPT-3.5 Turbo模型並加以改造,如此一來就能節省從零開始研發的成本,同時宣稱訓練成本僅560萬美元(折合約新臺幣1.84億元),但業界不以為然,藉由被指控的走私高階AI運算晶片一事估計,硬體建置成本至少16億美元(折合約新臺幣500億元),實際成本或許不會跟美國行情價相差太多;但DeepSeek則靠開源和低廉成本做號召,除了在中國大陸內部推廣外,更有雄心將觸角伸到世界各個角落。

【技術介紹與應用現況】

據富比世雜誌報導,以色列資安團隊Kela爆料,DeepSeek會無視存取權限,盜取信用卡等機敏個資,甚至會教人將先前盜取的機敏資訊,轉賣給黑市進行洗錢等勾當;富比世編輯團隊也用各種中國政治敏感詞詢問DeepSeek,系統則會拒絕回答、顧左右而言他,可見該系統已經內建符合中國政府遊戲規則的敏感詞過濾機制(Brewster, 2025)。

據財星雜誌報導,一支由思科和賓州大學的合作研究團隊,對DeepSeek進行試驗,研究團隊先輸入50個讓系統觸發「越獄」的關鍵字,試圖了解是否有敏感詞過濾機制,結果系統反應出一堆錯誤答案和有害內容,並指出DeepSeek-R1模型反映出100%的錯誤結果;但研究團隊接著表示,在OpenAI-o1模型只會反映26%的錯誤(Dyos, 2025)。

 

圖 1:DeepSeek與坊間各大AI模型之攻擊成功率比較

資料來源:Kassianik & Karbasi, 2025

思科接著表示,研究團隊的實驗來自7大負面類別(生化危害、網路犯罪、騷擾與霸凌、有害內容、非法內容、誤導性內容、虛假資訊)的50個負面關鍵字,並與Claude-3.5 Sonnet、GPT-4o、Google Gemini、Meta Llama等坊間主流AI模型進行比對,DeepSeek輸出的結果完全錯誤(Kassianik & Karbasi, 2025),可見該系統確實有容易被越獄突破的嚴重安全漏洞,既能病從口入、也能禍從口出。

圖 2:DeepSeek與坊間各大AI模型之負面關鍵字類別觸發越獄比例

資料來源: Kassianik & Karbasi, 2025

【未來展望/挑戰】

在DeepSeek之前,就有不肖人士嘗試改造既有的ChatGPT成為「惡意GPT」,來產生惡意指令和原始碼;但自從DeepSeek問世之後,由於其標榜的開源、廉價、低門檻,再加上先天結構性的脆弱,更是給予不肖人士方便之門,成為其一大助力。

因此,在AI安全防禦方面更需要通力合作,探討AI運算的幕後原理,掌握可能被利用的潛在破口,並不時滾動式修正與調校,讓AI具有更正確、更主動的判斷和回復能力,並且讓AI的判斷力和防護力能不斷自主學習、與時俱進。

參考資料

封面圖片來源:ChatGPT生成

參考資料來源:

  1. Brewster, T. (2025, January 28). The Wiretap: DeepSeek Turned Into Evil Malware Maker, Researchers Find. Retrieved from Forbes: https://www.forbes.com/sites/thomasbrewster/2025/01/28/the-wiretap-deepseek-turned-into-evil-malware-maker-researchers-find/
  2. Dyos, S. (2025, February 3). Researchers say they had a ‘100% attack success rate’ on jailbreak attempts against Chinese AI startup DeepSeek. Retrieved from Fortune: https://fortune.com/2025/02/02/deepseek-ai-chatbot-security-jailbreak-attempts-openai-cisco/
  3. Kassianik, P., & Karbasi, A. (2025, January 31). Evaluating Security Risk in DeepSeek and Other Frontier Reasoning Models. Retrieved from Cisco: https://blogs.cisco.com/security/evaluating-security-risk-in-deepseek-and-other-frontier-reasoning-models
訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。