设为首页收藏本站

中部财经网要闻 > 正文

OpenAI现允许网站阻止其网络爬虫抓取数据，避免数据被用于训练 AI 模型

2023-08-08 10:22:30| 来源: C114 通信网|

(资料图片)

OpenAI 旗下 GPT 模型的训练需要大量的网络数据，这可能涉及到数据隐私和版权等问题。为了解决这些问题，OpenAI 最近推出了一个新功能，让网站可以阻止其网络爬虫（web crawler）从其网站上抓取数据训练 GPT 模型。

据了解，网络爬虫是一种自动化的程序，可以在互联网上搜索和获取信息。OpenAI 的网络爬虫名为 GPTBot，其会以一定的频率访问各种网站，并将网页内容保存下来，用于训练 GPT 模型。

OpenAI 在其博客文章中表示，网站运营者可以通过在其网站的 Robots.txt文件中禁止 GPTBot 的访问，或者通过屏蔽其 IP 地址，来阻止 GPTBot 从其网站上抓取数据。OpenAI 还表示，“使用 GPTBot 用户代理（user agent）抓取的网页可能会被用于改进未来的模型，并且会过滤掉那些需要付费访问、已知收集个人身份信息（PII）、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源，“允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确，并提高它们的通用能力和安全性。”

但是，这并不会追溯性地从 ChatGPT 的训练数据中删除之前从网站上抓取的内容。

互联网为大型语言模型（如 OpenAI 的 GPT 模型和谷歌的 Bard）提供了大部分的训练数据，为 AI 训练获取数据已经变得越来越有争议。一些网站，包括 Reddit 和 Twitter，已经采取措施打击 AI 公司免费使用其用户帖子的行为，而一些作者和其他创作者也因为涉嫌未经授权使用其作品而提起诉讼。

标签：

收藏邀请

上一篇：应急管理部工程救援专业力量出击成功解除京津冀多处洪涝险情

猜你喜欢

支付宝能查个人征信吗？支付宝借呗贷款征信可以查到吗？

支付宝能查个人征信吗？支付宝借呗贷款征信可以查到吗？

支付宝能查个人征信吗?支付宝可以查个人征信，但不能查中国人民银行...

2023-04-26 08:21:33

期货模拟交易软件有哪些？股指期货交易方法是什么？

期货模拟交易软件有哪些？股指期货交易方法是什么？

期货模拟交易软件有哪些?1、金荣中国APP金荣中国(upwaytrack com ...

2023-04-07 15:06:57

余额宝收益什么时候到账？余额宝存入几天后有收益？

余额宝收益什么时候到账？余额宝存入几天后有收益？

余额宝收益什么时候到账?【1】转入时间为周一15:00(含15:00)~周二15...

2023-03-23 09:18:51

房贷还满一年退税是什么意思？住房公积金满一年可以贷款吗？

房贷还满一年退税是什么意思？住房公积金满一年可以贷款吗？

房贷还满一年退税是什么意思?房贷还满一年可以退税。房贷退税是指进...

2023-03-09 13:18:16

超龄打工有工伤保险吗？超龄怎么认定工伤？

超龄打工有工伤保险吗？超龄怎么认定工伤？

超龄打工有工伤保险吗?根据相关法律法规及司法实践，对于超过法定退...

2023-02-28 15:30:49

有花呗借呗可以贷款买房吗？花呗会影响征信吗？

有花呗借呗可以贷款买房吗？花呗会影响征信吗？

有花呗借呗可以贷款买房吗?有花呗借呗的贷款记录，只要没有逾期情况...

2023-02-20 10:55:41

七天通知存款是什么意思？七天通知存款可以手机银行支取吗？

七天通知存款是什么意思？七天通知存款可以手机银行支取吗？

七天通知存款是什么意思?七天通知存款是通知存款的一种，通知存款是...

2023-02-17 15:55:01

银行贷款一般几天下来？银行办理信贷多久到账？

银行贷款一般几天下来？银行办理信贷多久到账？

银行贷款一般几天下来?正常银行的贷款放款时间，都在7-30个工作日时...

2023-02-16 09:28:07

公积金提取条件是什么？公积金网上提取流程是怎样的？

公积金提取条件是什么？公积金网上提取流程是怎样的？

公积金提取条件是什么?1、购买、建造、翻建、大修自住住房的;2、达...

2023-02-13 08:55:20

公积金贷款利率和公积金缴纳多少有关吗？公积金贷款利率高吗？

公积金贷款利率和公积金缴纳多少有关吗？公积金贷款利率高吗？

公积金贷款利率和公积金缴纳多少有关吗?无关。公积金贷款利率是跟着...

2023-02-10 11:18:25

热点资讯

热门图片

最近更新

|关于我们 |联系我们 |网站地图 |广告服务

Powered by www.zbce.cn 中部财经网

© 2013-2017 联系我们：55 16 53 8 @qq.com

备案号：京ICP备2021034106号-59