业界动态
盗用未公开作品训练大模型?字节回应称传闻完全不实,数据,用户,进行
2024-07-23 06:11:24
盗用未公开作品训练大模型?字节回应称传闻完全不实,数据,用户,进行

7月22日,字节跳动回(hui)应豆包大模型训练(lian)数据来源非法的质疑。

近日有用户发帖称,能(neng)在豆包问到自己尚未发表过的作品,怀疑豆包使(shi)用WPS的云端内容(rong)训练(lian)AI,并(bing)表达了数据泄露的担忧。字节跳动对此表示(shi)“传言完全不实”。

字节跳动回(hui)应称,豆包上的部分书目信息(xi),来源于公开信息(xi),并(bing)给出相关网(wang)站(zhan)信息(xi)。有用户提到在豆包可以搜索出未发表过的作品情节,经核实该情节可以公开查询到,并(bing)非未发表作品。

字节跳动回(hui)应声明中的辟(pi)谣内容(rong)。

字节跳动还声明,豆包与WPS 在AI训练(lian)层(ceng)面并(bing)未开展任何形式的合作,也没有使(shi)用任何用户未公开的私(si)人(ren)数据进行训练(lian)。

前一日(7月21日),WPS亦在官方社(she)交账号澄清称,所有用户的文档不会被用于任何AI训练(lian)目的,也不会在未经用户同意的情况下用于任何场景。WPS AI与豆包在AI层(ceng)面目前并(bing)未开展任何形式的合作,不存在文档被用作AI训练(lian)的情况。

生成(cheng)式AI的训练(lian)数据合规风(feng)控,是悬在大模型厂(chang)商头上的一把“达摩克利斯之剑”。

今年5月下旬发布(bu)的国家标准《网(wang)络安(an)全技术(shu) 生成(cheng)式人(ren)工智能(neng)服(fu)务安(an)全基本要求》(征求意见稿)提到,数据用于训练(lian)前,应对数据中的主要知(zhi)识产权侵权风(feng)险进行识别,发现存在知(zhi)识产权侵权等问题的,服(fu)务提供者不应使(shi)用相关数据进行训练(lian)。该标准提到,将数据用于训练(lian)前,还应过滤去除数据中的违法不良信息(xi)——其中包括侵犯他人(ren)知(zhi)识产权和个人(ren)信息(xi)权益(yi)的内容(rong)。

字节跳动称,会尊重用户的信息(xi)安(an)全,并(bing)将尽最(zui)大努力,确保数据来源与使(shi)用的安(an)全性。

采写:南都(dou)见习记者 杨(yang)柳

发布(bu)于:广东(dong)省(sheng)
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7