世界即时看!大模型侵权第一案,学而思或被起诉偷数据
发布时间:2023-06-14 05:42:09 文章来源:36Kr
全社会都在关注各公司推出的大模型,但鲜少关注大模型背后的训练数据来


(相关资料图)

全社会都在关注各公司推出的大模型,但鲜少关注大模型背后的训练数据来自于哪,是否征得了数据版权方的授权,以及是否付费 ... 他至今记得,为了获得作文素材的数据,笔神作文用人工审核的方式、一篇一篇筛选投稿来的作文,通过打标签、分级、数据清洗(指发现及纠正数据文件中的错误)等,最终得以积累到目前的作文素材体量 ... 研究认为,这关系许多英语 AI 大模型所使用数据的正当性,比如是否有侵权,以及是否存在「脏数据」(比如本身就是盗版的数据)。

标签:

资讯播报

乐活HOT

娱乐LOVE

精彩推送