社交媒體平臺(tái)Reddit近日對(duì)人工智能公司Perplexity及其他相關(guān)企業(yè)提起訴訟,指控其未經(jīng)授權(quán)抓取網(wǎng)站數(shù)據(jù)用于人工智能模型訓(xùn)練。這起案件凸顯了當(dāng)前AI行業(yè)在訓(xùn)練數(shù)據(jù)獲取方式上存在的法律爭(zhēng)議。

根據(jù)向紐約聯(lián)邦法院提交的訴狀,Reddit將Perplexity AI、Oxylabs UAB、AWMProxy以及SerpApi四家公司列為被告。訴狀指出,這些公司通過(guò)技術(shù)手段繞過(guò)網(wǎng)站防護(hù)措施,擅自獲取Reddit平臺(tái)上的用戶(hù)評(píng)論和對(duì)話(huà)內(nèi)容。Reddit在聲明中強(qiáng)調(diào),其平臺(tái)作為全球規(guī)模最大、內(nèi)容最活躍的人類(lèi)對(duì)話(huà)數(shù)據(jù)庫(kù)之一,已成為數(shù)據(jù)抓取行為的主要目標(biāo)。
被告方對(duì)相關(guān)指控予以否認(rèn)。Perplexity在回應(yīng)中表示,其數(shù)據(jù)處理方式始終秉持原則且具有社會(huì)責(zé)任感,致力于通過(guò)人工智能技術(shù)為用戶(hù)提供真實(shí)準(zhǔn)確的信息服務(wù)。該公司強(qiáng)調(diào)將堅(jiān)決維護(hù)公眾自由獲取公共知識(shí)的權(quán)利。與此同時(shí),Oxylabs則提出異議,認(rèn)為任何企業(yè)都不應(yīng)對(duì)公共數(shù)據(jù)形成壟斷,暗示部分企業(yè)可能通過(guò)控制數(shù)據(jù)資源謀取不當(dāng)利益。
值得關(guān)注的是,Reddit在訴訟文件中將數(shù)據(jù)抓取行為形象比喻為“無(wú)法進(jìn)入金庫(kù),轉(zhuǎn)而搶劫運(yùn)輸車(chē)隊(duì)”。據(jù)悉,部分涉事公司通過(guò)規(guī)避谷歌安全防護(hù)并利用搜索引擎記錄的方式實(shí)施數(shù)據(jù)抓取。與此形成對(duì)比的是,谷歌和OpenAI已與Reddit達(dá)成正式數(shù)據(jù)使用協(xié)議,其中谷歌每年需支付6000萬(wàn)美元獲取數(shù)據(jù)訪(fǎng)問(wèn)權(quán)限。這一巨額費(fèi)用也讓業(yè)界關(guān)注到合法數(shù)據(jù)獲取的成本門(mén)檻。
需要指出的是,這已是Reddit今年內(nèi)第二次就類(lèi)似事由提起訴訟。今年6月,該平臺(tái)曾對(duì)人工智能公司Anthropic提起過(guò)相關(guān)訴訟。這一系列法律行動(dòng)反映出內(nèi)容平臺(tái)與AI技術(shù)公司在數(shù)據(jù)使用權(quán)方面的矛盾正日益凸顯。





























浙公網(wǎng)安備 33010502007447號(hào)