luke的使用[通俗易懂]

luke的使用[通俗易懂]zz网络首次用Luke打开索引文件。Overview里面显示了索引具有的Field数目(以最大的Field为准吧?),还有就是文档的总数和Term即索引词的总数?有时一个关键词,对应于多个文档,所

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

zz网络

首次用Luke打开索引文件。Overview里面显示了索引具有的Field数目(以最大的Field为准吧?),还有就是文档的总数和 Term即索引词的总数? 有时一个关键词,对应于多个文档,所以文档数要多于关键字数目。

还显示了索引的版本和索引的格式。 类似于Java class的格式做法,在文件头部放了对应的Lucene版本信息吧。。。

右下方的Rank是怎么算出来的?事实上我并没有做什么操作啊。。。

luke的使用[通俗易懂]


在Document视图,根据doc号,查看具体的文档项,这个功能不错。

luke的使用[通俗易懂]



通过Document标签可以查看各个Term,点击show All,会进入search页面,显示使用term查询,匹配的所有记录。 这里的term就相当于 查询关键字吧。。。

luke的使用[通俗易懂]

Luke的查询结果和直接的代码查询结果是一致的。。。

这个功能赞的。通过luke就可以直接研究索引文件里面的内容了。。。。。


luke的使用[通俗易懂]


在查询标签,
选择分词器。。。。点击查询就可以查了。。。 这里选择的是CJK分词器,针对东亚文字的分析器。。。


luke的使用[通俗易懂]



使用同一个数据源,现在搜到的东西是一样了,呵呵…

luke的使用[通俗易懂]



在Search标签页里,点击Explain structure,可以看到对查询字符串的分词结果。。。.

(在查询输入框)更新查询字符串之后,需要点击update,才会更新下面的字符。。。

luke的使用[通俗易懂]


Term对应的各个文档,这里相当于是遍历列表?从头到尾的遍历?也可以show all,这会跳转到Search标签。。也可以点击Show Position显示文档的位置信息这里的term frequency是指 term在文档中的出现次数只有Show all,才会触发Search,并跳转到Search标签

如下操作序列挺有意思的。 首先点击Next term,转到下一个Term,再点击First Doc,显示该Term的第一个Document。


luke的使用[通俗易懂]


同个Term对应的文档也是排序的? 这里根据Document之后的数字排列了,至少从截图上看起来是这样的。


luke的使用[通俗易懂]


Tool菜单栏里有个Check Index选项:

如下是我对当前操作索引的check操作。。。

Segments file=segments_2 numSegments=1 version=FORMAT_HAS_PROX [Lucene 2.4]
1 of 1: name=_0 docCount=153090
    compound=true
    hasProx=true
    numFiles=1
    size (MB)=17.396
    no deletions
    test: open reader………OK
    test: fields, norms…….OK [2 fields]
    test: terms, freq, prox…OK [88735 terms; 559179 terms/docs pairs; 563003 tokens]
    test: stored fields…….OK [306180 total field count; avg 2 fields per doc]
    test: term vectors……..OK [0 total vector count; avg 0 term/freq vector fields per doc]

No problems were detected with this index.

OverView里面的show top terms,显示的是 对应document数目最多的term。。。

可以通过Luke查看文档评分机制的。。。

numDocs是文档总数,docFreq是匹配这个term的文档总数。 idf是定义在这两个量之上的吧。。。。

queryNorm和fieldNorm是怎么算出来的

luke的使用[通俗易懂]


打开索引时,选择载入内存,速度会快很多。。。

luke的使用[通俗易懂]

 
 
 
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/166985.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • jira webhook发消息_jenkins webhook

    jira webhook发消息_jenkins webhookJIRAWebhookWebhook1处理webhook事件2变量替换3过滤器3.1JQL3.2Webhook事件类型3.2.1插件和系统事件3.2.2问题时间3.2.3版本事件3.2.4项目事件3.2.5用户事件3.2.6特征状态事件3.2.7备注事件3.2.8Confluencewebhook事件3.3例程请求3.4例程响应3.4.1Confluence…

    2022年10月27日
    0
  • 移动端开发基础知识「建议收藏」

    移动端开发基础知识「建议收藏」移动web开发指的是:需要适配移动设备的网页开发移动web开发与pc端web开发没有本质的区别,使用的还是HTML/CSS/JavaScript的技术移动端与pc端web开发的区别:1、浏览器不同移动端的浏览器与pc端不同谷歌浏览器苹果浏览器、UC浏览器QQ浏览器百度手机浏览器360安全浏览器搜狗浏览器猎豹浏览器等国内的手机浏览器都是根据webkit内核修…

    2022年6月24日
    24
  • 2021最新Java JDK1.8的安装教程

    2021最新Java JDK1.8的安装教程2021最新JavaJDK1.8安装教程(超详细)jdk1.8又称jdk8.0,是目前相对比较稳定的版本,不建议下载最新的jdk版本,因为最新版的jdk不稳定,在Java开发可能会出现各种各样的BUG。一、JDK下载1.官网下载点击官网下载地址找到自己电脑相对应的JDK,点击下载。如果不清楚自己的电脑是32位还是64位,可以找到“此电脑”,点击右键,选择属性,点开后就可以找到自己电脑位数。如图:勾选接受许可协议后点击下载会提示登录ORACLE账户,如果没有就用邮箱注册一个登录后就可以下

    2022年6月4日
    26
  • lldp协议代码阅读_查看链路层发现协议(LLDP)关于交换机的端口状态信息

    lldp协议代码阅读_查看链路层发现协议(LLDP)关于交换机的端口状态信息查看链路层发现协议(LLDP)关于交换机的端口状态信息客观链路层发现协议(LLDP)媒体终端发现(MED)提供另外的功能支持媒体终点设备例如到网络通告为应用程序修正类似语音或视频的enable(event),设备位置发现和故障排除信息。LLDP和思科设备发现协议(CDP)是两个相似的协议,并且区别是LLDP促进供应商互操作性,并且CDP是Cisco业主。LLDP可以用于用户需要工作在设备之间不是…

    2022年5月17日
    46
  • 查看已安装tensorflow版本

    查看已安装tensorflow版本由于tensorflow版本不同,可能一些函数的调用也有变换,这时候可能需要查看tensorflow版本,可以在终端输入查询命令如下:pythonimporttensorflowastftf.__version__查询tensorflow安装路径为:tf.__path__查询结果如下:

    2022年6月25日
    23
  • 中介者模式和观察者模式的区别_序列中介作用

    中介者模式和观察者模式的区别_序列中介作用中介者模式 Mediator动机模式定义结构要点总结笔记动机在软件构建过程中,经常会出现多个多个对象相互关联交互的情况,对象之间常常会维持一种复杂的引用关系.如果遇到一些需求的更改.这种直接的引用关系将面临不断地变化这种情况下,我们可以使用一个”中介对象”来管理对象间地关联关系,避免相互交互地对象之间地紧耦合引用关系,从而更好地抵御变换模式定义用一个中介对象来封装(封装变化)一系列地对象交互中.中介者使各个对象不需要显式地相互引用(编译时依赖->运行时依赖),从而使其耦合松散(管理变化),而

    2022年8月11日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号