您当前的位置：顺企网 » 产品供应 »中国商务服务网 » 软件开发 » Nlpir Parser大数据智能平台敏感词搜索

Nlpir Parser大数据智能平台敏感词搜索

更新时间：2017-05-03 14:53:27 信息编号：5132768 发布者IP：219.143.92.208 浏览：277次

供应商: 灵玖中科软件（北京）有限公司 商铺
认证: 资质核验：
已通过营业执照认证

入驻顺企：
第
8
年

主体名称：
灵玖中科软件（北京）有限公司

组织机构代码：
110108012441863
报价: 请来电询价
品牌: 灵玖软件
关键词: 大数据搜索语义分析智能挖掘中文分词
所在地: 北京市海淀区苏州街49-3号5层11号
联系电话: 010-62648216
市场部专员: 张先生 请说明来自顺企网，优惠更多

让卖家联系我

产品详细介绍

　　在网络日益发达的现在，也伴随着有益信息与造成不稳定因素的信息也随之日益泛滥，从而产生了大量的信息，这些信息中有一部分是有用的，而也有许多事垃圾信息。这些垃圾信息不会给网站带来额外的排名提升，只会给网站带来更多的负面影响，比如垃圾流量;网站用户体验降低;甚至影响网站的关键词排名。

　　敏感词过滤在各互联网是比较常见的操作，也有很多算法来处理这个问题，而在传统的算法很难把敏感词过滤掉或查找出来，随着自然语言技术的不断发展和完善，对敏感词的搜索和过滤起来重大作用。

　　Nlpir Parser大数据智能平台敏感词过滤系统由灵玖软件研制，可以导入大批量用户业务敏感的关键词列表，实现对内存与文件的实时智能扫描，生成命中的敏感关键词、敏感类别与权重等信息。并提供二次开发接口，可以无缝地融合到客户的各类复杂应用系统之中，可兼容Windows，Linux， Android，Maemo5, FreeBSD等不同操作系统平台，可以供Java，C，C#等各类开发语言使用。

　　Nlpir Parser大数据智能平台敏感词过滤系统扫描过程：

　　第一步：业务单位准备敏感词列表(可选，如不设置则默认为系统内置敏感词)

　　由监管部门整理出敏感词文本文件，每行设置一个关键词信息，具体格式如下：词类别权重。

　　说明如下：

　　1.关键词与类别完全由自己设置，不限制长度、格式与编码;

　　2.当前系统支持Zui大类别数为255个;

　　3. 权重标准建议为1-10。10表示Zui大，1表示Zui小。

　　4. 同一个词可以设置为不同的类别。

　　第二步：导入自定义的敏感词文件(可选，如不设置则默认为系统内置敏感词)

　　通过导入关键词即可，也可以使用批处理命令ImportUserDict.bat实现。

　　1000个关键词可以实现1分钟内导入，1万关键词5分钟以内，10万关键词约需30分钟，百万级别关键词的时间略长，预计需要半天的时间。导入的词表会以特定的格式加密存储。不会泄露用户的业务机密。

　　第三步：扫描内存或者文件

　　通过上面可以选择待扫描文件夹，即可实现数据的快速实时扫描。适合于小规模数据的测试。

　　大规模数据建议采用批处理命令KeyScanner.bat配置实现。待扫描文件的格式目前只支持文本文件，格式。批量扫描的结果输出到指定的结果文件，输出敏感的行号，并给出敏感的内容。

相关产品：大数据搜索 , 语义分析 , 智能挖掘 , 中文分词

所属分类：中国商务服务网 / 软件开发
本页链接：http://product.11467.com/info/5132768.htm

Nlpir Parser大数据智能平台敏感词搜索的文档下载： PDF DOC TXT

关于灵玖中科软件（北京）有限公司商铺首页 | 更多产品 | 联系方式 | 黄页介绍

主要经营：基础软件服务，应用软件服务；计算机系统服务；销售计算机、软件及附属设备

灵玖软件(ling-join-微场景宣传片)，专注于大数据语义搜索与挖掘的技术创新与服务，提供大数据搜索、大数据挖掘与大数据应用解决方案，以应对大数据的管理、处理、分析，并从大数据中获知识与智慧，将用 ...

相关文章

NLPIR汉语分词为大数据挖掘提供便捷方法
随着计算机网络的飞速普及,人们已经进入了信息时代。在这个信息社会里,信息的重要性与日俱增,无论是个人...
NLPIR智能语义技术为科研大数据挖掘提供不同体验
在互联网络迅猛发展的今天，各行各业都积累了大量宝贵的数据资料。科研信息领域亦是如此，卷数越来越多、内...
NLPIR：中文语义挖掘是自然语言处理的关键
随着科技的发展和网络的普及，人们可获得的数据量越来越多，这些数据多数是以文本形式存在的。而这些文本数...

我们的其他产品