OpenAI开源发布1.5B的隐私过滤模型 可以精确识别文本中包含的个人隐私信息
https://www.landiannews.com/archives/112793.html
人工智能公司 OpenAI 日前开源发布参数规模只有 1.5B 的隐私过滤模型 Privacy Filter,与常规大型语言模型不同,这个新模型主要是用来识别并自动清除用户提交内容中的个人信息,让其他 AI 系统处理数据时更加安全和可控。
Privacy Filter 模型经过自回归预训练,架构与 GPT-OSS 开源模型类似但规模更小,理论上说还可以在常规消费级设备上运行,例如集成到浏览器里用于自动清除用户提交的敏感信息。
注意:这个模型本身只是用于标记,开发者还需要搭配其他规则或模型将成功匹配出来的隐私内容清除,这个模型本身不会直接清除隐私内容并生成不含隐私内容的文本。
目前 OpenAI Privacy Filter 模型可以识别并清除如下个人隐私信息:姓名、地址、电话号码、邮箱地址、日期信息、账号、银行账号、URL 链接、密码、API 凭证等,模型会在处理过程中扫描整段文本,然后对敏感信息进行标记以方便后续进行遮蔽或替换。
https://www.landiannews.com/archives/112793.html
人工智能公司 OpenAI 日前开源发布参数规模只有 1.5B 的隐私过滤模型 Privacy Filter,与常规大型语言模型不同,这个新模型主要是用来识别并自动清除用户提交内容中的个人信息,让其他 AI 系统处理数据时更加安全和可控。
Privacy Filter 模型经过自回归预训练,架构与 GPT-OSS 开源模型类似但规模更小,理论上说还可以在常规消费级设备上运行,例如集成到浏览器里用于自动清除用户提交的敏感信息。
注意:这个模型本身只是用于标记,开发者还需要搭配其他规则或模型将成功匹配出来的隐私内容清除,这个模型本身不会直接清除隐私内容并生成不含隐私内容的文本。
目前 OpenAI Privacy Filter 模型可以识别并清除如下个人隐私信息:姓名、地址、电话号码、邮箱地址、日期信息、账号、银行账号、URL 链接、密码、API 凭证等,模型会在处理过程中扫描整段文本,然后对敏感信息进行标记以方便后续进行遮蔽或替换。