• <acronym id="qmqcg"><cite id="qmqcg"></cite></acronym>
    <td id="qmqcg"><em id="qmqcg"></em></td>
    • 首頁 > 資訊 >

      再讓AI大廠這么“偷”下去 咱就看不到免費的網站了

      幾天前,谷歌突然更新了隱私政策,明確表示要用網上所有的公開數據,來訓練自家的 AI 模型。

      也就是說,根據新政策,你在網上公開發布的任何信息都有可能被谷歌抓取,包括但不限于你發的帖子、搜索的關鍵詞以及看過的視頻。

      這不妥妥互聯網裸奔嗎!


      【資料圖】

      OpenAI 前腳剛被起訴數據侵權還沒多久,谷歌就馬上著急來撞槍口。

      在這個節骨眼上整這么一出,大概率跟數據收費脫不了關系,谷歌再不薅這波免費的羊毛,之后很有可能就薅不到咯。

      這事兒啊,自打 ChatGPT 爆火后再也沒消停過。

      世超先給大家伙兒捋捋時間線。

      今年 3 月的時候呢,馬斯克帶頭打響了數據收費第一槍,宣稱推特的 API 接口不再免費了。

      緊接著,美版貼吧Reddit 也按耐不住了。

      上個月 Reddit 鬧得沸沸揚揚的“停電”運動,就是為了抗議官方的 API 收費政策。

      之前世超寫這事兒的時候還在猜測, Reddit 官方最后會不會作出讓步。

      從現在的后續看來,大多第三方軟件已經確認關停, Reddit 是鐵了心要數據收費。

      再到這段時間,推特又整了限流的幺蛾子,沒有花錢認證的帳號每天就只能閱讀 600條貼文,目的呢也是為了防止機器人抓取用戶數據。

      難道數據就這么值錢嗎?

      世超覺著啊,還是AI的鍋。

      AI 大模型要想變得更聰明,就需要源源不斷的數據去“喂養”。

      現在能做大模型的,要不就是自己家有數據,像百度、阿里和騰訊;要不就是爬人家的數據,這里點名 OpenAI 。

      因為很多網站都開放有免費的 API 接口,才給了微軟、 OpenAI 這些巨頭可乘之機。

      但今時不同往日, AI 在重新賦予數據價值以后,有籌碼在手上的平臺當然不樂意被白嫖了。

      甚至于 Reddit 的 CEO 霍夫曼都把話搬上明面兒了:就是不想免費提供數據給巨頭們。

      所以, OpenAI 被起訴估計也是平臺們聯合起來想要“殺雞儆猴”,治一治 AI 的這股歪風邪氣。

      不過,法律這次會不會站在 OpenAI 這邊,還真不好說。

      因為數據版權涉及到 3 個關鍵的問題:

      1.數據爬蟲的行為本身是否是合法的?

      2.數據是否受到版權的保護?

      3.用數據生成的作品是否受到版權保護?

      首先第一個問題,要獲取數據,無非就是付費購買,或者收集網上公開的數據。

      但需要注意的是,公開的數據并不能等同于授權使用,而且還要看網站是不是有相關的條款對數據爬蟲行為做出了限制。

      要是直接越過版權方的同意,或者繞過了網站限制強行獲取數據,那就是妥妥的非法獲取計算機信息系統數據罪。

      即使 OpenAI 聲稱爬的是公開網站的數據,數據爬蟲行為本身是否合法,還要看版權方是不是給了授權。

      其次,關于數據本身是否受到版權保護。

      根據美國的版權法,如果 AI 模型訓練所用的數據符合“合理使用”的范圍,那就不會構成侵權。

      但問題就出在這“合理使用”上。

      “合理使用”的構成要件包括是否涉及商用、作品本身是否受版權法保護、所使用部分的數量以及使用之后對作品本身造成的影響這四個標準。

      像什么新聞報道、學術研究,適當引用是完全 ok 的。

      可 AI 模型上億萬級別的數據使用量、已經商業化的 AI 軟件,還能算作“合理使用”嗎?

      最后,就是AI生成作品的版權問題。

      因為訓練數據版權理不清, AI 生成的內容自然也會存在版權爭議。前幾天, Steam 還下架了一款使用了 AIGC 生成的游戲,理由就是版權有問題。

      咱就拿 AI 繪畫舉例子,圖像生成相當于一個拆分又重組的過程,雖然最后的結果是完全“新”的,但仍然會保留訓練圖像的某些特征。

      但這種情況到底算不算侵權,各國的說法現在也是眾說紛紜。

      因為訓練數據是人家的,美國版權局認定 AI 生成的作品不受版權法保護,甚至還可能侵犯著作權。

      而日本政府的態度則截然不同,表示日本法律不保護 AI 訓練所用數據的版權。

      至少在現行的法律框架下,上面這些問題很難得到一個統一的答案。

      既然監管不給力,那版權方就只有提刀自己干了,該收費的收費,該追償的也趕緊追償。

      ▼OpenAI被起訴的文件

      可以預見,在推特和 Reddit 之后,可能還會有更多的內容版權方豎起高墻。

      這事兒呢,對于平臺來說,當然是個掙錢的新路子,科技巨頭再不濟也就是多砸點兒錢。

      但對于整個互聯網來說,可算不上一件好事兒。

      當年,互聯網就是帶著開放共享的基因出生的,像什么維基百科、推特,之前常年免費提供 API 接口,開發者調用數據很方便。

      但現在如果讓數據收費這么一搞,結果會怎么樣還真不好說。

      畢竟,小開發者沒有支付巨額數據費的能力,如果創新只在巨頭里發生,這不就是純純搞壟斷了?

      最主要的是,可能很多現在免費能看到的網站之后就要花錢才能看了,這才是對咱們這種普通用戶的真實暴擊。

      其實吧,數據收費這事兒也不能全怪平臺,實在是讓 AI 巨頭給“搶”怕了,算是一種自保的無奈之舉。

      雖然這次谷歌有“隱私政策”護體,但結果如何還真不好說。

      所以,關鍵還要是看監管的大錘什么時候能落下。

      厘清數據版權,是 AI 要發展始終繞不過去的一道坎兒,而現在,似乎也同樣關乎著互聯網的未來走向。

      不知道 AI 這艘船,會將我們推向一個更開放,還是更封閉的時代?

      關鍵詞:

      責任編輯:Rex_12

      推薦閱讀
      亚洲线精品久久一区二区三区,成人看片在线观看,草草视频手机在线观看视频,亚洲六月丁香色婷婷综合久久
    • <acronym id="qmqcg"><cite id="qmqcg"></cite></acronym>
      <td id="qmqcg"><em id="qmqcg"></em></td>
      • 主站蜘蛛池模板: 亚洲国产超清无码专区| 成人av在线一区二区三区| 天堂va在线高清一区| 国产又色又爽又刺激在线观看| 人与动人物A级毛片在线| 久久99中文字幕久久| 另类欧美视频二区| 欧美jizz40性欧美| 夫妇野外交换hd中文小说| 国产亚洲精品美女久久久久 | 宅男666在线永久免费观看| 啦啦啦手机完整免费高清观看| 久久99国产精品久久99果冻传媒| 菠萝蜜视频在线观看入口| 无码人妻精品一二三区免费| 国产男女在线观看| 五月婷婷在线观看| 337p日本欧洲亚洲大胆精品555588| 激情久久av一区av二区av三区 | 一本无码人妻在中文字幕免费| 邻居少妇张开腿让我爽了在线观看| 欧美丰满白嫩bbxx| 国产视频中文字幕| 亚洲成AV人片在线观看无码不卡| 18videosex日本vesvvnn| 波多野结衣在线观看中文字幕| 国精品无码一区二区三区在线| 亚洲日韩欧美一区二区三区| av无码免费永久在线观看| 污污视频在线观看黄| 夜夜精品视频一区二区| 亚洲欧洲国产成人精品| 2020国产精品自拍| 欧美成a人片在线观看久| 国产精品…在线观看| 亚洲人成77777在线播放网站| 久草视频在线网| 无码一区二区三区在线| 免费福利在线观看| 一二三四社区在线高清观看在线| 综合无码一区二区三区|