业界动态
盗用未公开作品训练大模型?字节回应称传闻完全不实,数据,用户,进行
2024-07-22 00:54:19
盗用未公开作品训练大模型?字节回应称传闻完全不实,数据,用户,进行

7月(yue)22日,字节跳动回应(ying)豆包大模型训练数据来源非法的质(zhi)疑。

近日有用户发帖称(cheng),能在豆包问到自己尚未发表过的作(zuo)品,怀疑豆包使(shi)用WPS的云端内容训练AI,并表达了数据泄露(lu)的担忧。字节跳动对此表示“传(chuan)言(yan)完(wan)全不实”。

字节跳动回应(ying)称(cheng),豆包上的部分书目信息,来源于公开信息,并给出相关网站信息。有用户提(ti)到在豆包可以搜索出未发表过的作(zuo)品情节,经核实该情节可以公开查询到,并非未发表作(zuo)品。

字节跳动回应(ying)声明中的辟谣内容。

字节跳动还声明,豆包与WPS 在AI训练层面并未开展任何形式的合作(zuo),也没有使(shi)用任何用户未公开的私人数据进行(xing)训练。

前一日(7月(yue)21日),WPS亦在官方社交账号澄清称(cheng),所有用户的文档不会被用于任何AI训练目的,也不会在未经用户同意(yi)的情况下用于任何场景。WPS AI与豆包在AI层面目前并未开展任何形式的合作(zuo),不存(cun)在文档被用作(zuo)AI训练的情况。

生成式AI的训练数据合规风控,是悬在大模型厂(chang)商头上的一把“达摩克利斯之(zhi)剑”。

今年5月(yue)下旬发布的国家标准(zhun)《网络安全技术 生成式人工(gong)智能服务安全基本要求》(征求意(yi)见稿)提(ti)到,数据用于训练前,应(ying)对数据中的主要知识产权侵(qin)权风险进行(xing)识别,发现存(cun)在知识产权侵(qin)权等问题的,服务提(ti)供者不应(ying)使(shi)用相关数据进行(xing)训练。该标准(zhun)提(ti)到,将数据用于训练前,还应(ying)过滤去除数据中的违法不良信息——其中包括侵(qin)犯他人知识产权和个人信息权益的内容。

字节跳动称(cheng),会尊重用户的信息安全,并将尽最大努力,确保数据来源与使(shi)用的安全性。

采写:南(nan)都见习记者 杨柳

发布于:广东省
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7