Lucene(8_2_0)核心API学习 之 TokenStream(一)「建议收藏」

Lucene(8_2_0)核心API学习 之 TokenStream(一)「建议收藏」一、继承org.apache.lucene.analysis.TokenStreamentendsorg.apache.lucene.util.AttributeSource二、详情TokenStream是一个抽象类,是一系列Token的枚举,这里的Token有两个来源,一是Document的Fields,一是查询语句Query; 这是一个抽象类,有两个具体子类:Tokeni…

大家好,又见面了,我是你们的朋友全栈君。

一、继承

org.apache.lucene.analysis.TokenStream  entends org.apache.lucene.util.AttributeSource

二、详情

  1. TokenStream是一个抽象类,是一系列Token的枚举,这里的Token有两个来源,一是Document的Fields,一是查询语句Query;
  2. 这是一个抽象类,有两个具体子类:

Tokenizer,分词器,输入为Reader;

TokenFilter,过滤器,输入为TokenStream;

用法:一般先用分词器分词,然后用过滤器过滤,这样可以缩小搜索范围,提高效率;

      3. TokenStream继承于AttributeSource,AttributeSource提供给TokenStream访问所有Token属性Attributes的方法。注意每一个AttributeImpl(Attribute的实现类)只有一个实例(单例模式)被创造,然后被所有的tokens重复使用。这样做是为了减少创建对象的消耗,同时允许对AttributeImpl引用的本地缓存。看incrementToken()可以获得更多详情。

三、TokenStream工作流程的核心API

  1. 实例化(Instantiation):实例化一个TokenStream或TokenFilter需要从AttributeSource添加相应的属性;
  2. 状态重置(reset):消费者在使用token前一定要先将状态reset(),因为每一个属性是单例的,被所有token使用;
  3. 查询属性并存储在本地:消费者从stream流中检索属性,并在本地存储指向这些属性的引用;
  4. 调用incrementToken():消费者不断调用incrementToken,获取下一个Token,直到返回错误;
  5. end():消费者调用end()表示token已经遍历完了,可以执行一些遍历结束时的操作;
  6. close():释放相关资源;

        我的理解:把Token当做建立索引时lucene可以处理的最小单元,而TokenStream是一个存储了一系列Token的流,当你需要使用时,一个一个从流中取出Token来处理。

四、进一步解释

  • 为了确保消费者和过滤器知道哪些属性是可用的,这些属性必须在实例化时被添加进去。过滤器和消费者不小在incrementToken()中检查这些属性的可用性;
  • 应为TokenStream的API是基于装饰者模式的,因此所有的非抽象子类必须是final,或者至少有一个final修饰的incrementToken()的实现方法!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/163089.html原文链接:https://javaforall.net

(0)
上一篇 2022年7月22日 下午2:46
下一篇 2022年7月22日 下午3:00


相关推荐

  • 电脑爱好者必须懂得的电脑简单英语单词[通俗易懂]

    电脑爱好者必须懂得的电脑简单英语单词[通俗易懂]使用电脑必懂的53个英文单词和缩写!  ·PC:个人计算机PersonalComputer  ·CPU:中央处理器CentralProcessingUnit  ·CPUFan:中央处理器的“散热器”(Fan)  ·MB:主机板MotherBoard  ·RAM:内存RandomAccessMemory,以PC-代号划分规格,如PC-133,PC-1066,PC-27…

    2022年6月3日
    40
  • Android启动性能优化——闪屏及Splash页

    Android启动性能优化——闪屏及Splash页Android 启动性能优化 闪屏及 Splash 页本文我们将分析如何使用系统闪屏和 Splash 页来提升 APP 的启动性能 闪屏闪屏页是什么 启动闪屏不仅仅可以作为品牌宣传页 还能够减轻用户对启动耗时的感知 但是如果使用不恰当 将适得其反 当点击桌面图标启动 APP 的时候 程序会显示一个启动窗口 一直到页面的渲染加载完毕 如果程序的启动速度足够快 我们看的闪屏窗口停留显示的时间则会很短 但是当程序启动速度偏慢的时候 这个启动闪屏可以一定程度上减轻用户等待的焦虑感 避免用户过于轻易的关闭应用

    2025年6月3日
    6
  • CNS服务器搭建(配合百度直连)[通俗易懂]

    CNS服务器搭建(配合百度直连)[通俗易懂]CNS服务器搭建(配合百度直连)

    2025年8月2日
    5
  • 免费国内php空间_评测对焦速度

    免费国内php空间_评测对焦速度国外免费PHP空间终极对比,来自http://www.free-webhosts.com/php-hosting-comparison.php,http://www.free-webhosts.com是国外一家专业收集免费空间的网站,本博客以前也介绍过它:http://www.zhukun.net/blog/article.asp?id=154。其提供的免费空间数据,颇有参考价值。  此次评比

    2026年2月6日
    4
  • ext.apply()_函数evaluate的应用

    ext.apply()_函数evaluate的应用转载网址:http://www.cnblogs.com/yin-jingyu/archive/2011/07/30/2122176.htmlapply的用法:    Ext中apply及applyIf方法的应用apply及applyIf方法都是用于实现把一个对象中的属性应用于另外一个对象中,相当于属性拷贝。不同的是apply将会覆盖目标对象中的属性,而apply

    2022年7月28日
    6
  • 星际密码[通俗易懂]

    星际密码[通俗易懂]题目:https://www.nowcoder.com/pat/2/problem/254

    2022年8月2日
    13

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号