21世紀(jì)經(jīng)濟(jì)報(bào)道記者鐘雨欣徐倩宜
南方財(cái)經(jīng)全媒體記者馮戀閣北京、廣州報(bào)道
生成式AI再次“引爆”全球輿論關(guān)注。3月15日凌晨,OpenAI 發(fā)布多模態(tài)預(yù)訓(xùn)練大模型 GPT-4.據(jù)官方介紹,GPT-4支持圖像和文本輸入,以文本形式輸出;文字輸入限制提升,能處理超過25000個(gè)單詞的文本;更具創(chuàng)造力和準(zhǔn)確性。
(資料圖)
AI浪潮席卷之下,國(guó)內(nèi)大廠奮起直追,一天后,百度發(fā)布國(guó)內(nèi)首款對(duì)標(biāo)ChatGPT的產(chǎn)品“文心一言”,并在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成等多個(gè)場(chǎng)景中展現(xiàn)了產(chǎn)品能力。
毫無疑問,AIGC(人工智能生成內(nèi)容)正在給人類社會(huì)帶來一場(chǎng)深刻的變革。而剝開其令人眼花繚亂的華麗外表,運(yùn)行的核心離不開海量的數(shù)據(jù)支持。多位受訪專家表示,ChatGPT等AI技術(shù)在數(shù)據(jù)收集、處理、輸出等各環(huán)節(jié)都可能存在伴生風(fēng)險(xiǎn),如未經(jīng)授權(quán)收集信息、提供虛假信息、侵害個(gè)人隱私等等。監(jiān)管方和相關(guān)企業(yè)亟需從制度和技術(shù)方面共同發(fā)力,加強(qiáng)AIGC領(lǐng)域數(shù)據(jù)安全保護(hù)。
數(shù)據(jù)泄露、隱私侵害成隱憂
ChatGPT通過大量文本語(yǔ)料庫(kù)進(jìn)行訓(xùn)練,其深度學(xué)習(xí)能力很大程度上依賴于背后的數(shù)據(jù)。21世紀(jì)經(jīng)濟(jì)報(bào)道記者梳理發(fā)現(xiàn),出于對(duì)信息泄露的擔(dān)憂,目前已有多家公司和機(jī)構(gòu)發(fā)布“ChatGPT禁令”。
近日,軟銀、日立等日本企業(yè)已開始限制在商業(yè)運(yùn)營(yíng)中使用ChatGPT等互動(dòng)人工智能服務(wù)。軟銀就使用ChatGPT和其他類似應(yīng)用警告員工稱:“不要輸入公司的可識(shí)別信息或機(jī)密數(shù)據(jù)”。日立則將考慮制定新的道德規(guī)則,以規(guī)范交互式人工智能的使用。
今年2月,摩根大通成為第一家在工作場(chǎng)所限制使用ChatGPT的華爾街投行。花旗集團(tuán)和高盛集團(tuán)緊隨其后,前者禁止員工在整個(gè)公司范圍內(nèi)訪問ChatGPT,后者則限制員工在交易大廳使用該產(chǎn)品。而在更早些時(shí)候,亞馬遜和微軟為防備員工在使用ChatGPT的過程中泄密,禁止他們向其分享敏感數(shù)據(jù),因?yàn)檫@些信息可能會(huì)被用作進(jìn)一步迭代的訓(xùn)練數(shù)據(jù)。
北京師范大學(xué)法學(xué)院博士生導(dǎo)師、中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)研究中心副主任吳沈括在接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪時(shí)表示,ChatGPT作為大語(yǔ)言模型,它的核心邏輯事實(shí)上是海量數(shù)據(jù)的收集、加工、處理和運(yùn)算結(jié)果的輸出。“總的來說,這幾個(gè)環(huán)節(jié)可能會(huì)在技術(shù)要素、組織管理、數(shù)字內(nèi)容三個(gè)方面伴生相關(guān)風(fēng)險(xiǎn)。”
北京航空航天大學(xué)法學(xué)院副教授趙精武分析,在數(shù)據(jù)安全和個(gè)人信息保護(hù)領(lǐng)域,ChatGPT等AI技術(shù)的風(fēng)險(xiǎn)主要表現(xiàn)為用戶輸入的數(shù)據(jù)存在泄露風(fēng)險(xiǎn),倘若用戶為了完成工作任務(wù),輸入了敏感個(gè)人信息、商業(yè)秘密等信息,這些信息有可能被AI服務(wù)提供者留存。
南開大學(xué)法學(xué)院副院長(zhǎng)、中國(guó)新一代人工智能發(fā)展戰(zhàn)略研究院特約研究員陳兵教授進(jìn)一步指出,根據(jù)ChatGPT相關(guān)隱私政策可以看到,用戶在使用ChatGPT時(shí),會(huì)被采集有關(guān)用戶訪問、使用或互動(dòng)的信息。這意味著,包含用戶隱私以及用戶對(duì)話的數(shù)據(jù)可能會(huì)被OpenAI采集并存儲(chǔ)在其數(shù)據(jù)中心。
“雖然,ChatGPT表示,存儲(chǔ)訓(xùn)練和運(yùn)行模型所需的數(shù)據(jù)會(huì)嚴(yán)格遵守隱私和安全政策,但在未來可能出現(xiàn)網(wǎng)絡(luò)攻擊和數(shù)據(jù)爬取等現(xiàn)象,仍存在不可忽視的數(shù)據(jù)安全隱患。特別是涉及國(guó)家核心數(shù)據(jù)、地方和行業(yè)重要數(shù)據(jù)以及個(gè)人隱私數(shù)據(jù)的抓取、處理以及合成使用等過程,需平衡數(shù)據(jù)安全保護(hù)與流動(dòng)共享。”陳兵說。
除了數(shù)據(jù)與隱私泄露隱患外,同濟(jì)大學(xué)法學(xué)院副教授、上海市人工智能社會(huì)治理協(xié)同創(chuàng)新中心研究員陳吉棟指出,AI技術(shù)還存在著數(shù)據(jù)偏見、虛假信息、模型的難解釋性等問題,可能會(huì)導(dǎo)致誤解和不信任。
大成律師事務(wù)所高級(jí)合伙人肖颯則強(qiáng)調(diào)了AI技術(shù)“文本數(shù)據(jù)挖掘功能”潛藏的合規(guī)風(fēng)險(xiǎn)。她表示,該功能不僅可以“主動(dòng)”搜集和存儲(chǔ)數(shù)據(jù),并且能在不斷的數(shù)據(jù)處理過程中形成自己的處理模式。若其所搜集的數(shù)據(jù)(含個(gè)人信息)并未取得合法授權(quán),相關(guān)的處理活動(dòng)就可能涉嫌違法違規(guī)。
國(guó)內(nèi)企業(yè)引入ChatGPT需注意數(shù)據(jù)跨境合規(guī)
隨著生成式AI受到科技界“熱捧”,不少企業(yè)試圖在自身業(yè)務(wù)中引入和使用ChatGPT服務(wù)。而根據(jù)ChatGPT運(yùn)作原理,用戶在輸入端提問后,信息會(huì)傳輸?shù)絆penAI服務(wù)器上進(jìn)行運(yùn)算,隨后得到相應(yīng)回答。
記者在手機(jī)應(yīng)用商店搜索發(fā)現(xiàn),不少App打著“AI聊天機(jī)器人”“基于GPT提供AI寫作”的口號(hào)提供服務(wù),有的直稱“可接入ChatGPT接口”。
肖颯指出,由于ChatGPT本身具備收集、存儲(chǔ)和使用數(shù)據(jù)的功能,且用戶與其對(duì)話的數(shù)據(jù)也會(huì)被記錄,國(guó)內(nèi)企業(yè)若引入ChatGPT服務(wù),可能被認(rèn)定為數(shù)據(jù)出境活動(dòng)。
她介紹,在數(shù)據(jù)跨境合規(guī)方面,我國(guó)已經(jīng)初步形成了相關(guān)的法律體系,主要存在三種合規(guī)出境方式,即安全評(píng)估、個(gè)人信息保護(hù)認(rèn)證和個(gè)人信息出境標(biāo)準(zhǔn)合同。“相關(guān)企業(yè)必須依據(jù)《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》等相關(guān)規(guī)定,管理數(shù)據(jù)出境活動(dòng),依法辦事?!?/strong>
在趙精武看來,如果國(guó)內(nèi)企業(yè)試圖引入ChatGPT服務(wù),其合規(guī)要點(diǎn)在于:一是輸入輸出數(shù)據(jù)應(yīng)當(dāng)留存于境內(nèi);二是需要經(jīng)由工信部等主管部門審核,獲得相應(yīng)的信息服務(wù)資質(zhì)認(rèn)證;三是若對(duì)用戶個(gè)人信息權(quán)益產(chǎn)生實(shí)質(zhì)性影響,需要進(jìn)行個(gè)人信息安全影響評(píng)估;四是如果國(guó)內(nèi)企業(yè)屬于關(guān)鍵信息基礎(chǔ)設(shè)施運(yùn)營(yíng)者,其引入ChatGPT服務(wù)還需要進(jìn)行網(wǎng)絡(luò)安全審查。
另外,在執(zhí)法方面,陳兵表示,對(duì)于AIGC涉及的數(shù)據(jù)跨境流通問題,應(yīng)當(dāng)在考慮國(guó)際通行標(biāo)準(zhǔn)和做法的基礎(chǔ)上,制定合理的跨境數(shù)據(jù)安全執(zhí)法規(guī)則,加強(qiáng)與其他國(guó)家和地區(qū)規(guī)則的銜接,促進(jìn)數(shù)據(jù)安全跨境執(zhí)法合作。
加強(qiáng)全流程數(shù)據(jù)合規(guī)管理
面對(duì)前述潛藏風(fēng)險(xiǎn),監(jiān)管方和相關(guān)企業(yè)如何從制度和技術(shù)層面加強(qiáng)AIGC領(lǐng)域的數(shù)據(jù)安全保護(hù)?
吳沈括建議監(jiān)管側(cè)關(guān)注三方面規(guī)則?!耙皇鞘袌?chǎng)的準(zhǔn)入和資質(zhì)規(guī)則,確保優(yōu)良主體進(jìn)入該市場(chǎng)領(lǐng)域。二是業(yè)務(wù)監(jiān)管規(guī)則,確保主體的運(yùn)行符合既定的監(jiān)管框架要求。三是責(zé)任規(guī)則,要?jiǎng)澏ㄐ袨榧t線、責(zé)任紅線,明確各方主體的責(zé)任范圍,規(guī)范市場(chǎng)秩序?!?/p>
“相較于直接針對(duì)用戶終端采取限制使用等監(jiān)管措施,明確要求AI技術(shù)研發(fā)企業(yè)遵循科技倫理原則會(huì)更具成效,因?yàn)檫@些企業(yè)能夠在技術(shù)層面限定用戶的使用范圍。”趙精武說。
肖颯表示,對(duì)于監(jiān)管方而言,針對(duì)AI這種獨(dú)特的數(shù)據(jù)處理方式,最好在現(xiàn)行法律體系之下制定特別的規(guī)章制度,以規(guī)制企業(yè)運(yùn)用AI各類場(chǎng)景下的數(shù)據(jù)處理行為。
陳兵認(rèn)為,在制度層面,需要結(jié)合AIGC底層技術(shù)所需數(shù)據(jù)的特性和作用,建立健全數(shù)據(jù)分類分級(jí)保護(hù)制度。例如,可根據(jù)數(shù)據(jù)主體、數(shù)據(jù)處理程度、數(shù)據(jù)權(quán)利屬性等方面對(duì)訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行分類管理,根據(jù)數(shù)據(jù)對(duì)于數(shù)據(jù)權(quán)利主體的價(jià)值,以及數(shù)據(jù)一旦遭到篡改、破壞等對(duì)數(shù)據(jù)主體的危害程度進(jìn)行分級(jí)。在數(shù)據(jù)分類分級(jí)的基礎(chǔ)上,建立與數(shù)據(jù)類型和安全級(jí)別相配套的數(shù)據(jù)保護(hù)標(biāo)準(zhǔn)與共享機(jī)制。
目光投向企業(yè),陳兵建議加快推動(dòng)“隱私計(jì)算”技術(shù)在AIGC領(lǐng)域的應(yīng)用。“這類技術(shù)能夠讓多個(gè)數(shù)據(jù)擁有者在不暴露數(shù)據(jù)本身的前提下,通過共享SDK或者開放SDK權(quán)限的方式,在進(jìn)行數(shù)據(jù)的共享、互通、計(jì)算、建模,在確保AIGC能夠正常提供服務(wù)的同時(shí),保證數(shù)據(jù)不泄露給其他參與方?!?/p>
此外,多位專家在采訪中強(qiáng)調(diào)了“全流程合規(guī)管理”的重要性。
“企業(yè)首先應(yīng)關(guān)注其所運(yùn)用的數(shù)據(jù)資源是否符合法律法規(guī)要求,其次要確保算法和模型運(yùn)作的全流程合規(guī),另外,企業(yè)的創(chuàng)新研發(fā)應(yīng)最大限度地滿足社會(huì)公眾的倫理期待?!眳巧蚶ㄕf。
陳吉棟建議企業(yè)從數(shù)據(jù)收集、生產(chǎn)到應(yīng)用的全生命周期展開制度設(shè)計(jì)。“同時(shí),技術(shù)是法律監(jiān)管的核心工具,能夠確保監(jiān)管的穿透性,需要用技術(shù)守住數(shù)據(jù)合規(guī)底線?!?/p>
肖颯也表達(dá)了相似看法。她指出,企業(yè)應(yīng)制定內(nèi)部管理規(guī)范,設(shè)立相關(guān)的監(jiān)督部門,對(duì)AI技術(shù)應(yīng)用場(chǎng)景的各個(gè)環(huán)節(jié)進(jìn)行數(shù)據(jù)監(jiān)督,確保數(shù)據(jù)來源合法、處理合法、輸出合法,從而保障自身的合規(guī)性。
(文章來源:21世紀(jì)經(jīng)濟(jì)報(bào)道)
標(biāo)簽: