响应式网页设计公司,
索引的创建。索引创建时, 使用的是Lucene的索引器Index Writer类。对Index Writer类所使用的说话阐明器停止点窜, 使其撑持中文分词。
这里采纳了简朴的单汉字切分, 行将单个汉字作为一个术语, 使用Java CC编程完成。并且在生成索引器将撑持中文单汉字切分的说话阐明器作为参数传递给索引器成为索引器的成员, 使其在索引过程中使用该说话阐明器停止分词。
最后, 挪用Index Write类的add Document () , 将搜集爬虫抓取且转换为Document格式的文件, 按照字段范例停止别离处理, 到场到索引字段。
免责声明:本文内容由互联网用户自发贡献自行上传,本网站也不承担相关的法律责任。如果您发现本文章中有涉嫌抄袭的内容,请发送邮件至:sales@sznetsoft.com或者至电给本网站进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权的内容。