盗用未公开作品训练大模型？字节回应称传闻完全不实,数据,用户,进行20240723-业界动态-szhfh.com

盗用未公开作品训练大模型？字节回应称传闻完全不实,数据,用户,进行

2024-07-23 08:53:43

盗用未公开作品训练大模型？字节回应称传闻完全不实,数据,用户,进行

7月22日，字节跳动回(hui)应(ying)豆包(bao)大模型训练(lian)数据来源非法的质疑。

近(jin)日有用(yong)户发帖(tie)称，能在豆包(bao)问到自己(ji)尚未发表过的作品，怀(huai)疑豆包(bao)使(shi)用(yong)WPS的云端内容训练(lian)AI，并表达了数据泄露的担忧。字节跳动对(dui)此表示“传言完全不实”。

字节跳动回(hui)应(ying)称，豆包(bao)上的部分书目信息，来源于公开信息，并给出相关网站信息。有用(yong)户提到在豆包(bao)可以搜索出未发表过的作品情节，经核实该情节可以公开查询到，并非未发表作品。

字节跳动回(hui)应(ying)声(sheng)明中的辟谣内容。

字节跳动还声(sheng)明，豆包(bao)与(yu)WPS 在AI训练(lian)层面并未开展(zhan)任何(he)形(xing)式的合作，也没(mei)有使(shi)用(yong)任何(he)用(yong)户未公开的私人数据进行训练(lian)。

前一日（7月21日），WPS亦在官方社交账号澄清称，所有用(yong)户的文档不会(hui)被用(yong)于任何(he)AI训练(lian)目的，也不会(hui)在未经用(yong)户同意的情况(kuang)下用(yong)于任何(he)场(chang)景(jing)。WPS AI与(yu)豆包(bao)在AI层面目前并未开展(zhan)任何(he)形(xing)式的合作，不存在文档被用(yong)作AI训练(lian)的情况(kuang)。

生成式AI的训练(lian)数据合规风控(kong)，是悬在大模型厂商头上的一把(ba)“达摩克利斯之剑”。

今年5月下旬发布的国家(jia)标准《网络安全技术生成式人工智能服务安全基(ji)本(ben)要求》（征求意见稿(gao)）提到，数据用(yong)于训练(lian)前，应(ying)对(dui)数据中的主要知识产权侵权风险进行识别，发现存在知识产权侵权等问题的，服务提供者不应(ying)使(shi)用(yong)相关数据进行训练(lian)。该标准提到，将数据用(yong)于训练(lian)前，还应(ying)过滤去(qu)除数据中的违法不良信息——其中包(bao)括侵犯他人知识产权和个人信息权益的内容。

字节跳动称，会(hui)尊(zun)重(zhong)用(yong)户的信息安全，并将尽最大努力(li)，确保数据来源与(yu)使(shi)用(yong)的安全性。

采写：南(nan)都见习记(ji)者杨柳

发布于：广(guang)东省

版权号:18172771662813

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多