业界动态
盗用未公开作品训练大模型?字节回应称传闻完全不实,数据,用户,进行
2024-07-23 08:53:43
盗用未公开作品训练大模型?字节回应称传闻完全不实,数据,用户,进行

7月22日,字节跳动回(hui)应(ying)豆包(bao)大模型训练(lian)数据来源非法的质疑。

近(jin)日有用(yong)户发帖(tie)称,能在豆包(bao)问到自己(ji)尚未发表过的作品,怀(huai)疑豆包(bao)使(shi)用(yong)WPS的云端内容训练(lian)AI,并表达了数据泄露的担忧。字节跳动对(dui)此表示“传言完全不实”。

字节跳动回(hui)应(ying)称,豆包(bao)上的部分书目信息,来源于公开信息,并给出相关网站信息。有用(yong)户提到在豆包(bao)可以搜索出未发表过的作品情节,经核实该情节可以公开查询到,并非未发表作品。

字节跳动回(hui)应(ying)声(sheng)明中的辟谣内容。

字节跳动还声(sheng)明,豆包(bao)与(yu)WPS 在AI训练(lian)层面并未开展(zhan)任何(he)形(xing)式的合作,也没(mei)有使(shi)用(yong)任何(he)用(yong)户未公开的私人数据进行训练(lian)。

前一日(7月21日),WPS亦在官方社交账号澄清称,所有用(yong)户的文档不会(hui)被用(yong)于任何(he)AI训练(lian)目的,也不会(hui)在未经用(yong)户同意的情况(kuang)下用(yong)于任何(he)场(chang)景(jing)。WPS AI与(yu)豆包(bao)在AI层面目前并未开展(zhan)任何(he)形(xing)式的合作,不存在文档被用(yong)作AI训练(lian)的情况(kuang)。

生成式AI的训练(lian)数据合规风控(kong),是悬在大模型厂商头上的一把(ba)“达摩克利斯之剑”。

今年5月下旬发布的国家(jia)标准《网络安全技术 生成式人工智能服务安全基(ji)本(ben)要求》(征求意见稿(gao))提到,数据用(yong)于训练(lian)前,应(ying)对(dui)数据中的主要知识产权侵权风险进行识别,发现存在知识产权侵权等问题的,服务提供者不应(ying)使(shi)用(yong)相关数据进行训练(lian)。该标准提到,将数据用(yong)于训练(lian)前,还应(ying)过滤去(qu)除数据中的违法不良信息——其中包(bao)括侵犯他人知识产权和个人信息权益的内容。

字节跳动称,会(hui)尊(zun)重(zhong)用(yong)户的信息安全,并将尽最大努力(li),确保数据来源与(yu)使(shi)用(yong)的安全性。

采写:南(nan)都见习记(ji)者 杨柳

发布于:广(guang)东省
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7