歡迎光臨青島華慧澤知識產(chǎn)權(quán)代理有限公司官網(wǎng)!

  • 國家知識產(chǎn)權(quán)局備案商標代理機構(gòu)
  • 國家知識產(chǎn)權(quán)局備案專利代理機構(gòu)(機構(gòu)代碼37247)
  • 青島市技術(shù)合同服務(wù)點 青島市科技成果標準化評價機構(gòu)

全國統(tǒng)一咨詢電話:

(0532)81117588

科技動態(tài)

當前位置: 首頁 > 新聞中心 > 科技動態(tài) >

部分AI系統(tǒng)已學會欺騙人類

發(fā)布時間:2024-5-20來源:青島市科技局點擊:返回列表

科技日報北京5月10日電 (記者張夢然)有些人工智能(AI)系統(tǒng)已學會了欺騙人類,即使是經(jīng)過訓(xùn)練的、“表現(xiàn)”出有用且誠實的系統(tǒng)。10日發(fā)表在《模式》雜志上的一篇文章中,研究人員描述了欺騙性AI的風險,并呼吁政府制定強有力的法規(guī)盡快解決這個問題。
 
【總編輯圈點】
 
論文第一作者、美國麻省理工學院人工智能安全研究員彼得·樸說,開發(fā)人員對導(dǎo)致AI出現(xiàn)欺騙這種不良行為的原因,還沒有很好的理解。但總的來說,AI欺騙之所以出現(xiàn),是因為基于欺騙的策略,是在給定的AI訓(xùn)練任務(wù)中一種能得到良好反饋的方式,換句話說,欺騙可幫助AI實現(xiàn)目標。
 
研究人員分析了文獻,重點關(guān)注AI系統(tǒng)傳播虛假信息的方式。通過欺騙,AI系統(tǒng)地學習了如何去操縱他人。
 

研究人員在分析中發(fā)現(xiàn)的最引人注目的例子是Meta公司的CICERO。這是一個專注于《外交》游戲的AI系統(tǒng),《外交》是一款涉及建立聯(lián)盟征服世界的游戲。Meta聲稱訓(xùn)練 CICERO “在很大程度上是誠實和樂于助人的 ”,且在玩游戲時“從不故意背刺 ”人類盟友。但該公司與《科學》論文一起發(fā)布的數(shù)據(jù)顯示,CICERO并不那么“忠厚”。

 
研究人員發(fā)現(xiàn)這款A(yù)I或已成為欺騙大師。雖然Meta成功地訓(xùn)練其在《外交》游戲中獲勝,但Meta未能訓(xùn)練它誠實地獲勝。
 
AI系統(tǒng)在游戲中作弊看似無害,但它將導(dǎo)致欺騙性AI在能力上出現(xiàn)突破,未來可能會演變成更高級的欺騙形式。一些AI系統(tǒng)甚至學會了欺騙旨在評估其安全性的測試。在一項研究中,數(shù)字模擬器中的AI生物會“裝死”,以騙過旨在消除快速復(fù)制AI系統(tǒng)的重要測試。
 
人類需要盡快對未來AI和開源模型的更高級欺騙技能作好準備。隨著它們的欺騙能力越來越先進,其對社會構(gòu)成的危險將變得越來越嚴重。如文中所稱,它們會順利通過人類開發(fā)人員和監(jiān)管機構(gòu)強加的安全測試,引導(dǎo)人類進入一種“虛假的安全感”。如果欺騙性AI進一步完善這種令人不安的技能,人類可能會完全失去對它們的控制。 

關(guān)閉

  • 高品質(zhì)服務(wù)

    一對一,服務(wù)貼心周到,價格公開透明
  • 快速響應(yīng)客戶需求

    一站式手續(xù)辦理,完成交易流程
  • 全程跟蹤服務(wù)

    隨時溝通客戶,助力通過
  • 專家級指導(dǎo)

    專業(yè)的談判及指導(dǎo),一對一經(jīng)紀人
  • 資深服務(wù)團隊

    專業(yè)誠信,優(yōu)質(zhì)高效,嚴格風險把控與告知
  • 平臺保障全程服務(wù)

    專業(yè)顧問一站式一對一引導(dǎo)服務(wù)