深潮 TechFlow 消息,4 月 22 日,据官方消息,OpenAI 发布开源权重模型 Privacy Filter ,用于检测并遮蔽文本中的个人身份信息( PII )。该模型支持本地运行,可在单次前向处理中完成长文本识别与脱敏,最长支持 128,000 个 token 上下文。Privacy Filter 参数规模为 15 亿、活跃参数为 5,000 万,可识别私人姓名、地址、邮箱、电话号码、网址、日期、账户号码及密码、 API 密钥等机密信息。OpenAI 表示,该模型以 Apache 2.0 许可证在 Hugging Face 和 GitHub 上发布,可用于训练、索引、日志和审核等隐私保护流程。
添加收藏
分享社交媒体




