查看原文
科技

字节跳动:会全面检查、不得将 GPT 模型生成数据添加到训练数据集

云头条 2023-12-17

2023年12月16日,THE VERGE 报道称,字节跳动在使用 OpenAI 技术训练自己的大语言模型,违反了OpenAI 服务条款。

报道内容《突发!字节跳动被 OpenAI 封禁:因其使用 GPT 训练自家 AI 大模型》。

对此,字节跳动相关负责人回应称:“公司在使用OpenAI相关服务时,强调要遵守其使用条款。我们也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。”

以下是字节跳动使用 OpenAI 服务相关情况的介绍:

1

今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中。
该模型仅为测试,没有计划上线,也从未对外使用。
在 4 月公司引入 GPT API 调用规范检查后,这种做法已经停止。

2

早在今年4月,字节大模型团队已经提出了明确的内部要求,不得将 GPT 模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用 GPT 时遵守服务条款。

3

9月,公司内部又进行了一轮检查,采取措施进一步保证对 GPT 的 API 调用符合规范要求。
例如分批次抽样检测模型训练数据结果与 GPT 的相似度,避免数据标注人员私自使用 GPT。

4

未来几天里,我们会再次全面检查,以确保严格遵守相关服务的使用条款。

 相关阅读 ·


突发!字节跳动被 OpenAI 封禁:因其使用 GPT 训练自家 AI 大模型
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存