揭秘！ChatGPT的语言模型是如何开发的

ChatGPT人工智能2024-01-16 05:55:224301

先做个广告：如需代注册ChatGPT或充值 GPT5会员（plus），请添加站长微信：gptchongzhi

内容来源OpenAI官方人员Michael Schade 迈克尔·沙德的回答

推荐使用GPT中文版,国内可直接访问：https://ai.gpt86.top

OpenAI 的大型语言模型（包括为 ChatGPT 提供支持的模型）是使用三个主要信息源开发的：(1) 互联网上公开提供的信息，(2) 我们从第三方许可的信息，以及 (3)我们的用户或我们的培训师提供。

本文概述了我们用来帮助开发模型的公开信息，以及我们如何根据隐私法收集和使用这些信息。要了解我们如何收集和使用我们服务用户的信息，包括如何选择不使用 ChatGPT 对话来帮助教授我们的模型，请参阅我们的隐私政策和此帮助中心文章。

ChatGPT 是什么？它是如何工作的？

ChatGPT 是一项基于人工智能的服务，您可以通过互联网访问。您可以使用 ChatGPT 来组织或总结文本，或者编写新文本。ChatGPT 的开发方式使其能够理解并响应用户的问题和指令。它通过“阅读”大量现有文本并学习单词如何与其他单词一起出现在上下文中来实现这一点。然后，它使用所学到的知识来预测响应用户请求时可能出现的下一个最有可能的单词，以及之后的每个后续单词。这类似于搜索引擎、智能手机和电子邮件程序上的自动完成功能。

举个例子，在模型学习过程（称为“训练”）期间，我们可能会让模型尝试完成句子：“她没有向左转，而是转向___。” 在训练之前，模型会用随机单词进行响应，但当它读取和学习多行文本时，它可以更好地理解此类句子，并可以更准确地预测下一个单词。然后它在大量句子中重复这个过程。

因为这句话中接下来可能出现很多单词（例如，她不是向左转，而是“向右”、“绕行”或“向后”），因此模型的响应方式存在随机性元素，并且在许多情况下，我们的模型将以不同的方式回答同一问题。

机器学习模型由大串数字（称为“权重”或“参数”）以及解释和执行这些数字的代码组成。模型不包含或存储它们从中学习的信息的副本。相反，随着模型的学习，组成模型的一些数字会略有变化以反映它所学到的内容。在上面的示例中，模型读取的信息帮助其从预测随机错误单词改进为预测更准确的单词，但模型本身实际发生的只是数字略有变化。该模型不会存储或复制它读取的句子。

使用什么类型的信息来教授 ChatGPT？

如上所述，ChatGPT 和我们的其他服务是使用 (1) 互联网上公开提供的信息、(2) 我们从第三方获得许可的信息以及 (3) 我们的用户或培训师提供的信息开发的。本文重点关注第一组：互联网上公开的信息。

对于这组信息，我们仅使用互联网上免费公开的公开信息 - 例如，我们不会在付费专区或“暗网”中寻找信息。我们应用过滤器并删除我们不希望模型学习或输出的信息，例如仇恨言论、成人内容、主要聚合个人信息的网站和垃圾邮件。然后我们使用这些信息来训练我们的模型。

如上一节所述，ChatGPT 不会在数据库中复制或存储训练信息。相反，它学习单词之间的关联，这些学习帮助模型更新其数字/权重。然后，该模型使用这些权重来预测并生成新单词以响应用户请求。它不会“复制和粘贴”训练信息——就像一个人读了一本书并将其记下来一样，我们的模型在从中学习后无法访问训练信息。

个人信息是否用于教授 ChatGPT？

互联网上大量的数据都是与人相关的，所以我们的培训信息中确实也顺便包含了个人信息。我们不会主动寻找个人信息来训练我们的模型。

我们使用训练信息只是为了帮助我们的模型学习语言以及如何理解和回应它。我们现在和将来都不会使用培训信息中的任何个人信息来建立人员档案、联系他们、向他们做广告、试图向他们出售任何东西或出售信息本身。

我们的模型可以从个人信息中学习，以了解姓名和地址等内容如何适合语言和句子，或者了解名人和公众人物。这使得我们的模型能够更好地提供相关响应。

ChatGPT的开发如何遵守隐私法？

我们合法使用培训信息。大型语言模型有许多应用程序可以提供显着的好处，并且已经在帮助人们创建内容、改善客户服务、开发软件、定制教育、支持科学研究等等。如果没有大量信息来教授模型，这些好处就无法实现。此外，我们使用培训信息并不意味着对个人产生负面影响，并且该培训信息的来源已经公开。出于这些原因，我们根据 GDPR 等隐私法收集和使用培训信息中包含的个人信息，以合法利益为基础。为了履行我们的合规义务，我们还完成了数据保护影响评估，以帮助确保我们合法、负责任地收集和使用这些信息。

我们回应异议请求和类似权利。作为学习语言的结果，ChatGPT 响应有时可能包括其个人信息多次出现在公共互联网上的个人（例如公众人物）的个人信息。某些司法管辖区的个人可以通过填写此表格来反对我们的模型处理其个人信息。个人还可能有权访问、更正、限制、删除或转让我们的培训信息中可能包含的个人信息。您可以通过联系dsar@openai.com来行使这些权利。

请注意，根据隐私法，某些权利可能不是绝对的。如果我们有合法理由，我们可能会拒绝请求。但是，我们努力优先保护个人信息并遵守所有适用的隐私法。如果您认为我们没有充分解决问题，您有权向当地监管机构提出投诉。

我们保护培训信息并限制其使用和共享方式。为了确保这些信息的安全，我们使用商业上合理的技术、物理和管理措施，例如访问控制、审核日志、只读权限和加密存储的数据。有关我们安全实践的更多信息，请访问https://www.openai.com/security。

我们还采取措施减少训练模型时对个人信息的处理。例如，我们删除聚合大量个人信息的网站，并尝试训练我们的模型以拒绝对人员的私人或敏感信息的请求。

我们不会向第三方出售培训信息，并且仅在必要且符合我们的隐私政策的情况下披露部分信息。

我们仅在需要该信息来实现其预期目的时保留该信息。我们保留这些信息的时间取决于其数量、类型和敏感性、未经授权使用或共享造成损害的风险、这些信息对于训练或更新我们的模型是否仍然必要或有用以及任何法律要求等因素。

根据 GDPR，我们的数据控制者是 OpenAI OpCo, LLC（地址：3180 18th Street, San Francisco, CA, United States）。有关我们的欧洲经济区和英国数据保护事务代表的信息，请参阅我们的隐私政策。您可以通过privacy@openai.com联系我们的数据保护官。

chatgpt plus(GPT4)代充值