全文搜索 – Lucene标准分析仪和雪球

刚开始Lucene.Net。我使用标准分析器索引了100,000行,运行了一些测试查询,并注意到如果原始术语是单数,则复数查询不返回结果。我知道雪球分析仪增加了支持,这听起来不错。但是,我想知道如果锣与标准的雪球有任何缺点?我随身携带任何东西吗?有没有其他分析仪在那里考虑?
最佳答案
是的,通过使用诸如雪球之类的干扰素,您将丢失关于文本原始形式的信息。有时这将是有用的,有时不是。

例如,雪球将“组织”成为“机关”,因此搜索“组织”将以“机关”的形式返回结果,没有任何得分的惩罚。

这是否适合您取决于您​​的内容,以及您支持的查询类型(例如,搜索非常基础,或用户非常复杂,并使用搜索来精确筛选结果)。您可能还想查看较少侵略性的干扰物,如KStem

转载注明原文:全文搜索 – Lucene标准分析仪和雪球 - 代码日志