免费发布

Nlpir Parser大数据智能平台敏感词搜索

更新时间:2017-05-03 14:53:27 信息编号:5132768 发布者IP:219.143.92.208 浏览:276次
供应商
灵玖中科软件(北京)有限公司 商铺
认证
资质核验:
已通过营业执照认证
入驻顺企:
8
主体名称:
灵玖中科软件(北京)有限公司
组织机构代码:
110108012441863
报价
请来电询价
品牌
灵玖软件
关键词
大数据搜索 语义分析 智能挖掘 中文分词
所在地
北京市海淀区苏州街49-3号5层11号
联系电话
010-62648216
市场部专员
张先生  请说明来自顺企网,优惠更多
让卖家联系我

产品详细介绍

   在网络日益发达的现在,也伴随着有益信息与造成不稳定因素的信息也随之日益泛滥,从而产生了大量的信息,这些信息中有一部分是有用的,而也有许多事垃圾信息。这些垃圾信息不会给网站带来额外的排名提升,只会给网站带来更多的负面影响,比如垃圾流量;网站用户体验降低;甚至影响网站的关键词排名。

  敏感词过滤在各互联网是比较常见的操作,也有很多算法来处理这个问题,而在传统的算法很难把敏感词过滤掉或查找出来,随着自然语言技术的不断发展和完善,对敏感词的搜索和过滤起来重大作用。

  Nlpir Parser大数据智能平台敏感词过滤系统由灵玖软件研制,可以导入大批量用户业务敏感的关键词列表,实现对内存与文件的实时智能扫描,生成命中的敏感关键词、敏感类别与权重等信息。并提供二次开发接口,可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用。

  Nlpir Parser大数据智能平台敏感词过滤系统扫描过程:

  第一步:业务单位准备敏感词列表(可选,如不设置则默认为系统内置敏感词)

  由监管部门整理出敏感词文本文件,每行设置一个关键词信息,具体格式如下:词 类别 权重。

  说明如下:

  1.关键词与类别完全由自己设置,不限制长度、格式与编码;

  2.当前系统支持Zui大类别数为255个;

  3. 权重标准建议为1-10。10表示Zui大,1表示Zui小。

  4. 同一个词可以设置为不同的类别。

  第二步:导入自定义的敏感词文件(可选,如不设置则默认为系统内置敏感词)

  通过导入关键词即可,也可以使用批处理命令ImportUserDict.bat实现。

  1000个关键词可以实现1分钟内导入,1万关键词5分钟以内,10万关键词约需30分钟,百万级别关键词的时间略长,预计需要半天的时间。导入的词表会以特定的格式加密存储。不会泄露用户的业务机密。

  第三步:扫描内存或者文件

  通过上面可以选择待扫描文件夹,即可实现数据的快速实时扫描。适合于小规模数据的测试。

  大规模数据建议采用批处理命令KeyScanner.bat配置实现。待扫描文件的格式目前只支持文本文件,格式。批量扫描的结果输出到指定的结果文件,输出敏感的行号,并给出敏感的内容。

相关产品:大数据搜索 , 语义分析 , 智能挖掘 , 中文分词
所属分类:中国商务服务网 / 软件开发
本页链接:http://product.11467.com/info/5132768.htm
Nlpir Parser大数据智能平台敏感词搜索的文档下载: PDF DOC TXT
关于灵玖中科软件(北京)有限公司商铺首页 | 更多产品 | 联系方式 | 黄页介绍
主要经营:基础软件服务,应用软件服务;计算机系统服务;销售计算机、软件及附属设备
灵玖软件(ling-join-微场景宣传片),专注于大数据语义搜索与挖掘的技术创新与服务,提供大数据搜索、大数据挖掘与大数据应用解决方案,以应对大数据的管理、处理、分析,并从大数据中获知识与智慧,将用 ...
相关文章
顺企网 | 公司 | 黄页 | 产品 | 采购 | 资讯 | 免费注册 轻松建站
免责声明:本站信息由企业自行发布,本站完全免费,交易请核实资质,谨防诈骗,如有侵权请联系我们   法律声明  联系顺企网
© 11467.com 顺企网 版权所有
ICP备案: 粤B2-20160116 / 粤ICP备12079258号 / 粤公网安备 44030702000007号 / 互联网药品信息许可证:(粤)—经营性—2023—0112