fulltext mysql_mysql深入理解全文索引fulltext及实例剖析

fulltext mysql_mysql深入理解全文索引fulltext及实例剖析本文章通过以下几个小章节向大家介绍 mysql 全文索引的相关知识 mysql 全文索引原理及使用条件如何创建全文索引全文索引的基本语法及使用方法全文索引使用实例 mysql 全文索引使用条件首页要先明白 mysql 的全文检索原理 mysql 使用的是一个非常简单的剖析器来将文本分隔成词 空格 标点等 比如 welcomtoyou 将分隔为三个词 welcom to you 但是对中文来说 比如

本文章通过以下几个小章节向大家介绍mysql全文索引的相关知识:

mysql全文索引原理及使用条件

如何创建全文索引

全文索引的基本语法及使用方法

全文索引使用实例

mysql全文索引使用条件

首页要先明白mysql的全文检索原理:mysql使用的是一个非常简单的剖析器来将文本分隔成词,空格、标点等,比如‘welcom to you’将分隔为三个词‘welcom’、‘to’、‘you’,但是对中文来说,比如‘人力方网站正式上线’,这将无法分隔,因此目前mysql只支持 英文的全文检索。

mysql全文索引使用条件有两个,一个是对表存储引擎类型的要求,二是对设置全文索引字段的类型的要求。

表的存储引擎是MyISAM,默认存储引擎InnoDB不支持全文索引(新版本MYSQL5.6的InnoDB支持全文索引)

字段类型:只有字段类型为char、varchar和text的字段才能设置全文索引。

mysql如何创建全文索引

全文索引可以在创建表的时候设置,也可以在已有的表中进行设置。

1.创建表时设置全文索引,具体代码如下:

CREATE TABLE IF NOT EXISTS `category` (

`id` int(10) NOT NULL auto_increment,

`fid` int(10) NOT NULL,

`catname` char(255) NOT NULL,

`addtime` char(10) NOT NULL,

PRIMARY KEY (`id`),

FULLTEXT KEY `catname` (`catname`)

) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=5 ;

从上面代码可以看出,设置某字段为全文索引的SQL代码为FULLTEXT KEY `catname` (`catname`)

2.再已有的表中为某字段设置全文索引:

ALTER TABLE

或者直接在myphpadmin控制台中点击结尾处的{全文搜索}即可设置全文索引,不同MYSQL版本名字可能不同。

mysql全文索引的基本语法

全文索引搜索语法

MATCH (列名1, 列名2,…) AGAINST (搜索字符串 [搜索修饰符])

其中在match里面指定的列名1、2等,就是在建立全文索引中指定的列名, 后面的搜索修饰符说明如下:

search_modifier:

{

IN NATURAL LANGUAGE MODE

| IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION

| IN BOOLEAN MODE

| WITH QUERY EXPANSION

}

如:

SELECT * FROM tableName WHERE MATCH(fields) AGAINST (‘search term’)

mysql全文索引实例

首页我们建立表与初始化数据

CREATE TABLE IF NOT EXISTS `category` (

`id` int(10) NOT NULL auto_increment,

`fid` int(10) NOT NULL,

`catname` char(255) NOT NULL,

`addtime` char(10) NOT NULL,

PRIMARY KEY (`id`),

FULLTEXT KEY `catname` (`catname`)

) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=5 ;

/* http://www.manongjc.com/article/1443.html */

INSERT INTO `category` (`id`, `fid`, `catname`, `addtime`) VALUES

(1, 0, ‘welcome to you!’, ”),

(2, 0, ‘hello phpjs,you are welcome’, ”),

(3, 0, ‘this is the fan site of you’, ”);

在具体实例之前,我们分析下msyql全文检索的语法:函数 MATCH() 对照一个文本集(包含在一个 FULLTEXT 索引中的一个或多个列的列集)执行一个自然语言搜索一个字符串。搜索字符串做为 AGAINST() 的参数被给定。搜索以忽略字母大小写的方式执行。说白了就是MATCH给定匹配的列(fulltext类型索引),AGAINST给定要匹配的字符串,多 个用空格、标点分开,mysql会自动分隔。

操作一:

SELECT * FROM `category` WHERE MATCH(catname) AGAINST(‘phpjs’)

返回结果:

id

fid

catname

addtime

2

0

hello phpjs,you are welcome

匹配出了含有phpjs关键字的行数据。

操作二:

SELECT * FROM `category` WHERE MATCH (catname) AGAINST (‘this’)

按照上面的思路,第三行数据含有this,因此应该可以匹配出第三行数据的,但事实却奇怪得很,返回结果为空,为什么呢?

原来是mysql指定了最小字符长度,默认是4,必须要匹配大于4的才会有返回结果,可以用SHOW VARIABLESLIKE ‘ft_min_word_len’ 来查看指定的字符长度,也可以在mysql配置文件my.ini 更改最小字符长度,方法是在my.ini 增加一行 比如:ft_min_word_len = 2,改完后重启mysql即可。

操作三:

这里我们要确定把最小字符改为2了,因为3行记录都有‘you’,因此心想,匹配‘you’就可以返回所有结果了

SELECT * FROM `category` WHERE MATCH (catname) AGAINST (‘you’)

返回结果还是为空,大跌眼镜了吧,这又是为什么呢?

原来mysql在集和查询中的对每个合适的词都会先计算它们的权重,一个出现在多个文档中的词将有较低的权重(可能甚至有一个零权重),因为在这个 特定的集中,它有较低的语义值。否则,如果词是较少的,它将得到一个较高的权重,mysql默认的阀值是50%,上面‘you’在每个文档都出现,因此是 100%,只有低于50%的才会出现在结果集中。

操作四:

有人会想,我不去管权重大小,只要有匹配的就给我返回结果集中,那么该如何做呢?

mysql到 4.0.1 时,可以使用 IN BOOLEAN MODE 修饰语来执行一个逻辑全文搜索

SELECT * FROM `category` WHERE MATCH(catname) AGAINST(‘you’ IN BOOLEAN MODE)

总结:

要注意最小字符的长度;

要注意关键词的权重;

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/233334.html原文链接:https://javaforall.net

(0)
上一篇 2025年7月28日 下午4:01
下一篇 2025年7月28日 下午4:22


相关推荐

  • 安利一款超级无敌好用的pycharm字体 Fira Code

    安利一款超级无敌好用的pycharm字体 Fira CodeFiraCodeFira 是 Mozilla 主推的字体系列 FiraCode 是基于 FiraMono 等宽字体的一个扩展 主要特点是加入了编程连字特性 ligatures FiraCode 就是利用这个特性对编程中的常用符号进行优化 比如把输入的 直接显示成 或者把 gt 变成 等等 以此来提高代码的可读性 安装方法首先点击下载字体包密码

    2026年3月17日
    2
  • 全栈工程师的发展_web全栈工程师前景

    全栈工程师的发展_web全栈工程师前景在小米和出来创业的这两个多月里,通过猎头或自己投简历,先后面试了知乎,今日头条,豌豆荚,美团,百度,AppAnnie,去哪儿,滴滴打车等技术团队,一二面(技术面)几乎都轻松的过了,三面却没有毕业那会的干脆。回想两年前刚毕业那会,去百度,创新工场,搜狗面试,全都一二三面一次通过,在面试完回家的路上就拿到了offer,去年加入小米亦是如此。工作两年后,随着项目经验的积累,技术能力的沉淀,团队管理的娴

    2025年6月22日
    7
  • 这个符号叫反单引号

    这个符号叫反单引号这个符号叫反单引号

    2026年3月11日
    2
  • 为什么百度查到的ip和ipconfig查到的不一样;详解公网Ip和私网ip;详解网络分类ABC;

    为什么百度查到的ip和ipconfig查到的不一样;详解公网Ip和私网ip;详解网络分类ABC; IP可以分为PublicIP和PrivateIP,出现这种规划的原因在于IPv4所能表示的IP太少而电脑太多以至于不够用,然而只有PublicIP才能直接连接上网络,所以对于那些公司,学校,政府机构等场所,就可以集中使用私有的IP进行管理,而大家可以共用一个IP去连接上公网,这样,就省下了许多宝贵的PublicIP。你有没有发现,你每次使用ipconfig查到的地址,要么就是172….

    2022年6月6日
    130
  • 安卓浏览器横评_flash浏览器

    安卓浏览器横评_flash浏览器近日国外媒体AndroidAuthority就对全球使下载最大的11款手机浏览器进行了性能方面的横向评测,相信在看完后,你能够从中找到更适合自己的手机浏览器。(注:本测试主要针对浏览器性能,并不能说明浏览器的整体效果)一、测试设备、工具及浏览器介绍1、测试设备Nexus4,运行Android4.4.2系统。2、测试浏览器本次测试的浏览器总共11款,分别是:-百度浏览器3.1.0.2(国际…

    2025年8月12日
    3
  • linux出现e325错误,centos系统使用VI访问文件时候出现E325: ATTENTION类的错误提示处理方法…[通俗易懂]

    linux出现e325错误,centos系统使用VI访问文件时候出现E325: ATTENTION类的错误提示处理方法…[通俗易懂]错误出现情况的是,在我们用VI编辑文件时候在文件加载时候出现错误提示,需要在安任意键后才能正常编辑.错误提示类似如下:E325:ATTENTIONFoundaswapfilebythename”/etc/sysconfig/.iptables.swp”ownedby:rootdated:SunMar1209:53:432017filename:/etc/sy…

    2022年5月19日
    51

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号