亚洲欧美日韩国产综合一区二区_亚洲偷精品国产五月丁香麻豆_精品久久久久久中文字幕202_久久国产亚洲精品美女_国产精品调教视频一区

不再向大模型免費(fèi)開放數(shù)據(jù)!Reddit要求科技巨頭付費(fèi)使用API接口

2023-04-20 13:11:20

社交平臺(tái)Reddit不想再讓科技巨頭們免費(fèi)使用海量數(shù)據(jù)了。

當(dāng)?shù)貢r(shí)間4月18日,據(jù)《紐約時(shí)報(bào)》,Reddit近日表示,計(jì)劃開始向訪問(wèn)其應(yīng)用程序編程接口(API) 的公司收費(fèi),外部企業(yè)可以通過(guò)付費(fèi)下載和處理社交網(wǎng)絡(luò)中的海量對(duì)話。


【資料圖】

公開資料顯示,Reddit被稱為“美國(guó)版百度貼吧”,是一家擁有18年歷史的社交媒體平臺(tái),用戶可以在上面發(fā)帖、評(píng)論、交流各種話題。

近年來(lái),Reddit上發(fā)布的聊天內(nèi)容已成為谷歌、OpenAI和微軟等公司的訓(xùn)練素材,這些公司正在搜集和使用Reddit平臺(tái)上的對(duì)話來(lái)開發(fā)ChatGPT等生成式人工智能產(chǎn)品。

“Reddit的數(shù)據(jù)語(yǔ)料庫(kù)非常有價(jià)值,”Reddit創(chuàng)始人兼CEO史蒂夫·霍夫曼在接受《紐約時(shí)報(bào)》采訪時(shí)表示,“但我們不想把這些內(nèi)容免費(fèi)提供給一些巨頭公司?!?/p>

Reddit也成為首批公開表態(tài)要求科技巨頭付費(fèi)使用數(shù)據(jù)的企業(yè)。

“這些人工智能公司使用Reddit數(shù)據(jù)創(chuàng)造價(jià)值,卻不將任何價(jià)值返回給Reddit用戶,這是不合理的?!被舴蚵J(rèn)為,在他看來(lái),為此向這些科技巨頭收費(fèi)是一個(gè)公平的舉措。

據(jù)《紐約時(shí)報(bào)》,谷歌、Open AI和微軟尚未回應(yīng)此事。谷歌開發(fā)的聊天機(jī)器人Bard的底層算法部分是在Reddit數(shù)據(jù)上訓(xùn)練的,OpenAI的ChatGPT也引用Reddit數(shù)據(jù)作為接受培訓(xùn)的信息來(lái)源之一。

Reddit尚未公開具體的收費(fèi)規(guī)則和種類,外界預(yù)期將根據(jù)數(shù)據(jù)大小實(shí)行分類價(jià)格。

霍夫曼表示,Reddit的API將繼續(xù)免費(fèi)提供給希望構(gòu)建應(yīng)用程序,幫助人們使用Reddit的開發(fā)人員,出于非商業(yè)目的研究Reddit數(shù)據(jù)的研究人員也可以繼續(xù)免費(fèi)訪問(wèn)。

未來(lái),Reddit希望將更多機(jī)器學(xué)習(xí)納入網(wǎng)站應(yīng)用中,例如用來(lái)識(shí)別Reddit上人工智能生成文本的使用,并添加標(biāo)簽來(lái)通知用戶該評(píng)論來(lái)自機(jī)器人。同時(shí),還將支持論壇管理員使用幫助監(jiān)控用戶發(fā)帖內(nèi)容的第三方機(jī)器人,方便管理。

Reddit此舉或許與其今年計(jì)劃IPO(首次公開募股)有關(guān)。

Reddit成立于2005年,主要收入來(lái)源于平臺(tái)上的廣告和電子商務(wù)交易。Reddit表示,它仍在敲定API訪問(wèn)收費(fèi)的細(xì)節(jié),并將在未來(lái)幾周內(nèi)公布價(jià)格。

值得注意的是,除了Reddit之外,其他公司也逐漸不再愿意免費(fèi)提供平臺(tái)數(shù)據(jù)。當(dāng)?shù)貢r(shí)間4月19日,美國(guó)消費(fèi)者新聞與商業(yè)頻道(CNBC)報(bào)道,社交媒體推特CEO埃隆·馬斯克威脅要起訴微軟。馬斯克指責(zé)微軟非法使用其社交媒體推特上的數(shù)據(jù),以訓(xùn)練其人工智能模型。

此前有媒體報(bào)道,微軟的廣告平臺(tái)將停止支持推特,因?yàn)橥铺馗牧似銩PI的定價(jià)。馬斯克在這條推文下留言,“他們非法使用推特?cái)?shù)據(jù)進(jìn)行訓(xùn)練。訴訟時(shí)間到了。”根據(jù)推特的新定價(jià),API用戶(包括企業(yè)和研究機(jī)構(gòu))每月至少需要支付高達(dá)4.2萬(wàn)美元才可使用。

據(jù)CNBC報(bào)道,類似于GPT的大型語(yǔ)言模型需要TB級(jí)數(shù)據(jù)庫(kù)(存儲(chǔ)數(shù)據(jù)量為1TB以上)進(jìn)行訓(xùn)練,其中大部分?jǐn)?shù)據(jù)從社交網(wǎng)站Reddit、程序員問(wèn)答社區(qū)StackOverflow和推特等網(wǎng)站中抓取——來(lái)自社交網(wǎng)絡(luò)的培訓(xùn)數(shù)據(jù)非常有價(jià)值,因?yàn)槠渚哂蟹钦綀?chǎng)合的交互對(duì)話。

(文章來(lái)源:澎湃新聞)

標(biāo)簽:

關(guān)閉
新聞速遞