字节跳动：会全面检查、不得将 GPT 模型生成数据添加到训练数据集

云头条 2023-12-17

2023年12月16日，THE VERGE 报道称，字节跳动在使用 OpenAI 技术训练自己的大语言模型，违反了OpenAI 服务条款。

对此，字节跳动相关负责人回应称：“公司在使用OpenAI相关服务时，强调要遵守其使用条款。我们也正与OpenAI联系沟通，以澄清外部报道可能引发的误解。”

以下是字节跳动使用 OpenAI 服务相关情况的介绍：

今年年初，当技术团队刚开始进行大模型的初期探索时，有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中。

该模型仅为测试，没有计划上线，也从未对外使用。

在 4 月公司引入 GPT API 调用规范检查后，这种做法已经停止。

早在今年4月，字节大模型团队已经提出了明确的内部要求，不得将 GPT 模型生成的数据添加到字节大模型的训练数据集，并培训工程师团队在使用 GPT 时遵守服务条款。

9月，公司内部又进行了一轮检查，采取措施进一步保证对 GPT 的 API 调用符合规范要求。

例如分批次抽样检测模型训练数据结果与 GPT 的相似度，避免数据标注人员私自使用 GPT。

未来几天里，我们会再次全面检查，以确保严格遵守相关服务的使用条款。

相关阅读 ·

突发！字节跳动被 OpenAI 封禁：因其使用 GPT 训练自家 AI 大模型

继续滑动看下一个