luke的使用[通俗易懂]

luke的使用[通俗易懂]zz网络首次用Luke打开索引文件。Overview里面显示了索引具有的Field数目(以最大的Field为准吧?),还有就是文档的总数和Term即索引词的总数?有时一个关键词,对应于多个文档,所

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

zz网络

首次用Luke打开索引文件。Overview里面显示了索引具有的Field数目(以最大的Field为准吧?),还有就是文档的总数和 Term即索引词的总数? 有时一个关键词,对应于多个文档,所以文档数要多于关键字数目。

还显示了索引的版本和索引的格式。 类似于Java class的格式做法,在文件头部放了对应的Lucene版本信息吧。。。

右下方的Rank是怎么算出来的?事实上我并没有做什么操作啊。。。

luke的使用[通俗易懂]


在Document视图,根据doc号,查看具体的文档项,这个功能不错。

luke的使用[通俗易懂]



通过Document标签可以查看各个Term,点击show All,会进入search页面,显示使用term查询,匹配的所有记录。 这里的term就相当于 查询关键字吧。。。

luke的使用[通俗易懂]

Luke的查询结果和直接的代码查询结果是一致的。。。

这个功能赞的。通过luke就可以直接研究索引文件里面的内容了。。。。。


luke的使用[通俗易懂]


在查询标签,
选择分词器。。。。点击查询就可以查了。。。 这里选择的是CJK分词器,针对东亚文字的分析器。。。


luke的使用[通俗易懂]



使用同一个数据源,现在搜到的东西是一样了,呵呵…

luke的使用[通俗易懂]



在Search标签页里,点击Explain structure,可以看到对查询字符串的分词结果。。。.

(在查询输入框)更新查询字符串之后,需要点击update,才会更新下面的字符。。。

luke的使用[通俗易懂]


Term对应的各个文档,这里相当于是遍历列表?从头到尾的遍历?也可以show all,这会跳转到Search标签。。也可以点击Show Position显示文档的位置信息这里的term frequency是指 term在文档中的出现次数只有Show all,才会触发Search,并跳转到Search标签

如下操作序列挺有意思的。 首先点击Next term,转到下一个Term,再点击First Doc,显示该Term的第一个Document。


luke的使用[通俗易懂]


同个Term对应的文档也是排序的? 这里根据Document之后的数字排列了,至少从截图上看起来是这样的。


luke的使用[通俗易懂]


Tool菜单栏里有个Check Index选项:

如下是我对当前操作索引的check操作。。。

Segments file=segments_2 numSegments=1 version=FORMAT_HAS_PROX [Lucene 2.4]
1 of 1: name=_0 docCount=153090
    compound=true
    hasProx=true
    numFiles=1
    size (MB)=17.396
    no deletions
    test: open reader………OK
    test: fields, norms…….OK [2 fields]
    test: terms, freq, prox…OK [88735 terms; 559179 terms/docs pairs; 563003 tokens]
    test: stored fields…….OK [306180 total field count; avg 2 fields per doc]
    test: term vectors……..OK [0 total vector count; avg 0 term/freq vector fields per doc]

No problems were detected with this index.

OverView里面的show top terms,显示的是 对应document数目最多的term。。。

可以通过Luke查看文档评分机制的。。。

numDocs是文档总数,docFreq是匹配这个term的文档总数。 idf是定义在这两个量之上的吧。。。。

queryNorm和fieldNorm是怎么算出来的

luke的使用[通俗易懂]


打开索引时,选择载入内存,速度会快很多。。。

luke的使用[通俗易懂]

 
 
 
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/166985.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • goland 2021.3.1激活破解方法「建议收藏」

    goland 2021.3.1激活破解方法,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月15日
    848
  • 黑客暴力激活成功教程必备的12大逆向工具!设置再复杂的密码也没用!

    黑客暴力激活成功教程必备的12大逆向工具!设置再复杂的密码也没用!暴力激活成功教程攻击是最流行的密码激活成功教程方法之一,然而,它不仅仅是密码激活成功教程。暴力攻击还可用于发现Web应用程序中的隐藏页面和内容,在你成功之前,这种攻击基本上是“攻击一次尝试一次”。暴力激活成功教程是最流行的密码激活成功教程方法之一,然而,它不仅仅是密码激活成功教程。暴力激活成功教程还可用于发现Web应用程序中的隐藏页面和内容,在你成功之前,这种激活成功教程基本上是“激活成功教程一次尝试一次”。这种激活成功教程有时需要更长的时间,但其成功率也会更高。在本文中…

    2022年8月22日
    7
  • 批量下载ts视频文件

    批量下载ts视频文件第一步使用chrome按F12进入开发模式,拖动视频进度条到视频结束;然后找到.m3u8以结尾的文件并保存为文本文件。第二步点开查看里面是否存在如下以ts结尾的文件内容……/20180802/eXLFMdky/800kb/hls/QV7N1B14122999.ts/20180802/eXLFMdky/800kb/hls/QV7N1B14123000.ts…

    2022年7月18日
    22
  • Android 中arm64-v8a、armeabi-v7a、armeabi、x86简介~

    Android 中arm64-v8a、armeabi-v7a、armeabi、x86简介~LZ是一名96年Android小生,从14年9月培训出来到现在,差不多俩年多的时间,由于一些原因,没能好好把技术提升一下,实乃不该啊。了解起因昨天师傅问,你知道这俩个是什么么?有什么作用么?(如下图所示)现在还记得我那一脸蒙比的样子,诺诺的回答不晓得。师傅说这个是为了兼容一些手机,(此处省略滔滔不绝若干。。。)。听的我更加蒙比了,之前只是知道要把.so库扔进去,但是为什么扔,就不懂了,何谈我怎

    2022年6月10日
    43
  • Git 工具 – 高级合并「建议收藏」

    高级合并在Git中合并是相当容易的。因为Git使多次合并另一个分支变得很容易,这意味着你可以有一个始终保持最新的长期分支,经常解决小的冲突,比在一系列提交后解决一个巨大的冲突要好。然而,有时也会有棘手的冲突。不像其他的版本控制系统,Git并不会尝试过于聪明的合并冲突解决方案。Git的哲学是聪明地决定无歧义的合并方案,但是如果有冲突,它不会尝试智能地自动解决它。因此,如果很久之后才合并两个分叉的分支,你可能会撞上一些问题。在本节中,我们将会仔细查看那些问题是什么以及Git

    2022年4月6日
    73
  • win10安装PHP环境

    下载地址:https://windows.php.net/downloads/releases/然后将下载的文件解压到本地目录,我放在F:\wamp\目录下的php文件夹(不要下载非线程安全的版本,里面没有phpX(5,7)apache2_4.dll的拓展文件),配置apache的时候要用到将php配置在apache里,没安装apache环境的参考:https://blog.csdn….

    2022年4月8日
    45

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号