Nlpir Parser大数据智能平台敏感词搜索
更新时间:2017-05-03 14:53:27 信息编号:5132768 发布者IP:219.143.92.208 浏览:277次- 供应商
- 灵玖中科软件(北京)有限公司 商铺
- 认证
- 资质核验:已通过营业执照认证入驻顺企:第8年主体名称:灵玖中科软件(北京)有限公司组织机构代码:110108012441863
- 报价
- 请来电询价
- 品牌
- 灵玖软件
- 关键词
- 大数据搜索 语义分析 智能挖掘 中文分词
- 所在地
- 北京市海淀区苏州街49-3号5层11号
- 联系电话
- 010-62648216
- 市场部专员
- 张先生 请说明来自顺企网,优惠更多
产品详细介绍
在网络日益发达的现在,也伴随着有益信息与造成不稳定因素的信息也随之日益泛滥,从而产生了大量的信息,这些信息中有一部分是有用的,而也有许多事垃圾信息。这些垃圾信息不会给网站带来额外的排名提升,只会给网站带来更多的负面影响,比如垃圾流量;网站用户体验降低;甚至影响网站的关键词排名。
敏感词过滤在各互联网是比较常见的操作,也有很多算法来处理这个问题,而在传统的算法很难把敏感词过滤掉或查找出来,随着自然语言技术的不断发展和完善,对敏感词的搜索和过滤起来重大作用。
Nlpir Parser大数据智能平台敏感词过滤系统由灵玖软件研制,可以导入大批量用户业务敏感的关键词列表,实现对内存与文件的实时智能扫描,生成命中的敏感关键词、敏感类别与权重等信息。并提供二次开发接口,可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用。
Nlpir Parser大数据智能平台敏感词过滤系统扫描过程:
第一步:业务单位准备敏感词列表(可选,如不设置则默认为系统内置敏感词)
由监管部门整理出敏感词文本文件,每行设置一个关键词信息,具体格式如下:词 类别 权重。
说明如下:
1.关键词与类别完全由自己设置,不限制长度、格式与编码;
2.当前系统支持Zui大类别数为255个;
3. 权重标准建议为1-10。10表示Zui大,1表示Zui小。
4. 同一个词可以设置为不同的类别。
第二步:导入自定义的敏感词文件(可选,如不设置则默认为系统内置敏感词)
通过导入关键词即可,也可以使用批处理命令ImportUserDict.bat实现。
1000个关键词可以实现1分钟内导入,1万关键词5分钟以内,10万关键词约需30分钟,百万级别关键词的时间略长,预计需要半天的时间。导入的词表会以特定的格式加密存储。不会泄露用户的业务机密。
第三步:扫描内存或者文件
通过上面可以选择待扫描文件夹,即可实现数据的快速实时扫描。适合于小规模数据的测试。
大规模数据建议采用批处理命令KeyScanner.bat配置实现。待扫描文件的格式目前只支持文本文件,格式。批量扫描的结果输出到指定的结果文件,输出敏感的行号,并给出敏感的内容。
- NLPIR汉语分词为大数据挖掘提供便捷方法随着计算机网络的飞速普及,人们已经进入了信息时代。在这个信息社会里,信息的重要性与日俱增,无论是个人...
- NLPIR智能语义技术为科研大数据挖掘提供不同体验在互联网络迅猛发展的今天,各行各业都积累了大量宝贵的数据资料。科研信息领域亦是如此,卷数越来越多、内...
- NLPIR:中文语义挖掘是自然语言处理的关键随着科技的发展和网络的普及,人们可获得的数据量越来越多,这些数据多数是以文本形式存在的。而这些文本数...
- Nlpir Parser数据智能平台文本挖掘系统品牌:灵玖软件
- Nlpir Parser全文智能搜索系统品牌:灵玖软件
- Nlpir Parser汉语分词系统品牌:灵玖软件
- NlpirParser敏感词语义技术应用品牌:灵玖软件
- Nlpir Parser智能平台敏感信息过滤10,000.00元/套
- Nlpir Parser智能挖掘平台敏感信息过滤
- NlpirParser智能语义分析文本新算法10,000.00元/套
- NlpirParser大数据挖掘平台智能新词发现