盗用未公开作品训练大模型？字节回应称传闻完全不实,数据,用户,进行20240722-业界动态-szhfh.com

盗用未公开作品训练大模型？字节回应称传闻完全不实,数据,用户,进行

2024-07-22 00:54:19

盗用未公开作品训练大模型？字节回应称传闻完全不实,数据,用户,进行

7月(yue)22日，字节跳动回应(ying)豆包大模型训练数据来源非法的质(zhi)疑。

近日有用户发帖称(cheng)，能在豆包问到自己尚未发表过的作(zuo)品，怀疑豆包使(shi)用WPS的云端内容训练AI，并表达了数据泄露(lu)的担忧。字节跳动对此表示“传(chuan)言(yan)完(wan)全不实”。

字节跳动回应(ying)称(cheng)，豆包上的部分书目信息，来源于公开信息，并给出相关网站信息。有用户提(ti)到在豆包可以搜索出未发表过的作(zuo)品情节，经核实该情节可以公开查询到，并非未发表作(zuo)品。

字节跳动回应(ying)声明中的辟谣内容。

字节跳动还声明，豆包与WPS 在AI训练层面并未开展任何形式的合作(zuo)，也没有使(shi)用任何用户未公开的私人数据进行(xing)训练。

前一日（7月(yue)21日），WPS亦在官方社交账号澄清称(cheng)，所有用户的文档不会被用于任何AI训练目的，也不会在未经用户同意(yi)的情况下用于任何场景。WPS AI与豆包在AI层面目前并未开展任何形式的合作(zuo)，不存(cun)在文档被用作(zuo)AI训练的情况。

生成式AI的训练数据合规风控，是悬在大模型厂(chang)商头上的一把“达摩克利斯之(zhi)剑”。

今年5月(yue)下旬发布的国家标准(zhun)《网络安全技术生成式人工(gong)智能服务安全基本要求》（征求意(yi)见稿）提(ti)到，数据用于训练前，应(ying)对数据中的主要知识产权侵(qin)权风险进行(xing)识别，发现存(cun)在知识产权侵(qin)权等问题的，服务提(ti)供者不应(ying)使(shi)用相关数据进行(xing)训练。该标准(zhun)提(ti)到，将数据用于训练前，还应(ying)过滤去除数据中的违法不良信息——其中包括侵(qin)犯他人知识产权和个人信息权益的内容。

字节跳动称(cheng)，会尊重用户的信息安全，并将尽最大努力，确保数据来源与使(shi)用的安全性。

采写：南(nan)都见习记者杨柳

发布于：广东省

版权号:18172771662813

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多