mysql 查看函数fsync_sync/fsync/fdatasync的简单比较

mysql 查看函数fsync_sync/fsync/fdatasync的简单比较此文主要转载自官网上有关于MySQL的flushmethod的设置参数说明,但可能很多人不太明白。下文就详细说明此问题。首先官网的说明如下:http://dev.mysql.com/doc/refman/5.6/en/innodb-parameters.html#sysvar_innodb_flush_methodinnodb_flush_methodCommand-LineFormat–i…

大家好,又见面了,我是你们的朋友全栈君。

此文主要转载自

官网上有关于MySQL的flush method的设置参数说明,但可能很多人不太明白。下文就详细说明此问题。

首先官网的说明如下:

http://dev.mysql.com/doc/refman/5.6/en/innodb-parameters.html#sysvar_innodb_flush_method

innodb_flush_methodCommand-Line Format–innodb_flush_method=name

Option-File Formatinnodb_flush_method

System Variable Name

Variable ScopeGlobal

Dynamic VariableNo

Permitted Values (<= 5.6.6)

Type (Linux)string

Defaultfdatasync

Valid ValuesO_DSYNC

O_DIRECT

Permitted Values (<= 5.6.6)

Type (HP-UX)string

Defaultfdatasync

Valid ValuesO_DSYNC

O_DIRECT

Permitted Values (<= 5.6.6)

Type (Solaris)string

Defaultfdatasync

Valid ValuesO_DSYNC

O_DIRECT

Permitted Values (>= 5.6.7)

Type (Linux)string

Defaultfdatasync

Valid Valuesfdatasync

O_DSYNC

O_DIRECT

O_DIRECT_NO_FSYNC

Permitted Values (>= 5.6.7)

Type (Solaris)string

Defaultfdatasync

Valid Valuesfdatasync

O_DSYNC

O_DIRECT

O_DIRECT_NO_FSYNC

Permitted Values (>= 5.6.7)

Type (HP-UX)string

Defaultfdatasync

Valid Valuesfdatasync

O_DSYNC

O_DIRECT

O_DIRECT_NO_FSYNC

Controls the system calls used to          flush data to the          InnoDB data

files and log

files, which can influence I/O throughput. This

variable is relevant only for Unix and Linux systems. On

Windows systems, the flush method is always          async_unbuffered and cannot be changed.

By default, InnoDB uses the          fsync() system call to flush both the data

and log files. If          innodb_flush_method option is

set to O_DSYNC, InnoDB

uses O_SYNC to open and flush the log

files, and fsync() to flush the data files.

If O_DIRECT is specified (available on some

GNU/Linux versions, FreeBSD, and Solaris),          InnoDB uses O_DIRECT (or          directio() on Solaris) to open the data

files, and uses fsync() to flush both the

data and log files. Note that InnoDB uses          fsync() instead of          fdatasync(), and it does not use          O_DSYNC by default because there have been

problems with it on many varieties of Unix.

An alternative setting is          O_DIRECT_NO_FSYNC: it uses the          O_DIRECT flag during flushing I/O, but

skips the fsync() system call afterwards.

This setting is suitable for some types of filesystems but not

others. For example, it is not suitable for XFS. If you are

not sure whether the filesystem you use requires an          fsync(), for example to preserve all file

metadata, use O_DIRECT instead.

Depending on hardware configuration, setting          innodb_flush_method to          O_DIRECT or          O_DIRECT_NO_FSYNC can have either a

positive or negative effect on performance. Benchmark your

particular configuration to decide which setting to use, or

whether to keep the default. Examine the          Innodb_data_fsyncs status

variable to see the overall number of          fsync() calls done with each setting. The

mix of read and write operations in your workload can also

affect which setting performs better for you. For example, on

a system with a hardware RAID controller and battery-backed

write cache, O_DIRECT can help to avoid

double buffering between the InnoDB buffer

pool and the operating system’s filesystem cache. On some

systems where InnoDB data and log files are

located on a SAN, the default value or          O_DSYNC might be faster for a read-heavy

workload with mostly SELECT statements.

Always test this parameter with the same type of hardware and

workload that reflects your production environment. For

general I/O tuning advice, see          Section 8.5.7, “Optimizing InnoDB Disk I/O”.

Formerly, a value of fdatasync also

specified the default behavior. This value was removed, due to

confusion that a value of fdatasync caused          fsync() system calls rather than          fdatasync() for flushing. To obtain the

default value now, do not set any value for          innodb_flush_method at

startup.

里面提到了fsync()和fdatasync()系统调用,下文给予了详细解释。

之前在研究MySQL的一个参数innodb_flush_method时,就涉及到了fsync/fdatasync这些系统调用[system

call](什么是系统调用?它与库函数的区别在哪?参见这里)。接下来就简单的分析一下sync/fsync/fdatasync的区别。

sync():int sync( void )这就是它的原型,A call to this function will not

return as long as there is data which has not been written to the

device,sync()同步写,没有写到物理设备就不会返回,但是现实中并不是这样的。在kernel的手册上有解释:BUGS部分(linux中用man查看命令的时候不是都有一个BUGS部分么,就是指的那个)According

to the standard specification (e.g., POSIX.1-2001), sync() schedules the writes, but may return before the

actual writing is done.  However, since version 1.3.20 Linux does

actually wait.  (This still does not guarantee

data integrity: modern disks have large

caches.)也就是sync()负责将这些写物理设备的请求放入写队列,但是不一定写真正被完成了。

fsync(int fd):The fsync function can be used to make sure all data

associated with the open file fildes is written to the device associated with

the

descriptor。fsync()负责将一个文件描述符(什么是文件描述符,它是unix、类unix系统打开文件的一种方式,应该相当于打开文件的一个句柄一样)打开的文件写到物理设备,而且是真正的同步写,没有写完成就不会返回,而且写的时候讲文件本身的一些元数据都会更新到物理设备上去,比如atime,mtime等等。

fdatasync(int fd):When a call to the fdatasync function returns, it

is ensured that all of the file data is written to the

device。它只保证开打文件的数据全部被写到物理设备上,但是一些元数据并不是一定的,这也是它与fsync的区别。

这三个系统调用都简单的介绍完,那么为什么需要它们三个呢?最简单的说是从应用的需求来考虑的,sync是全局的,对整个系统都flush,fsync值针对单个文件,fdatasync当初设计是考虑到有特殊的时候一些基本的元数据比如atime,mtime这些不会对以后读取造成不一致性,因此少了这些元数据的同步可能会在性能上有提升(但fsync和fdatasync两者的性能差别有多大?这个不知道有谁测过没)。所以说三者是根据不同的需求而定的。

接下来谈谈flush dirty

page,也就是前面说的同步写(没写完的话阻塞后面,直到写完才返回)。为什么是刷脏页?脏页表示缓存中的页(一般也就是内存中)也物理设备上的页处于不一致,不一致是由于在内存中被修改。所以为了使内存中的修改持久化到物理磁盘上我们需要将其从内存中flush到物理磁盘上。根据我的理解,一般来说缓存分成这几种:1>应用程序自己带了缓存,比如InnoDB的buffer

pool;2>os层面上的缓存

;3>磁盘设备自己的缓存,比如raid卡一般都管理着自己的缓存;4>磁盘本身或许会有一点点缓存(这个不确定,自己猜想的,这个即使有估计也是极小的)。好了,那么大部分的时候我们说的flush

dirty

page都是指从应用程序的缓存->os的缓存->物理设备,如果物理设备没有缓存的话,此时也就相当于持久化成功,但是像磁盘做了raid,raid卡有缓存的话,实际上还没真正持久化成功,因为此时还只到了raid卡的缓存,没到物理设备,但是由于raid卡一般都带有备用电池,所以即使此时断电也不会造成数据丢失。

刚才说了很多时候应用自己也有缓存机制,那么你是否想过此时与os的缓存有重复呢?答案是:会的。刚才说了我是通过研究MySQL的一个参数innodb_flush_method注意这些的,innodb_flush_method表示flush策略,MySQL提供了fdatasync/O_DSYNC/O_DIRECT这三个选项,默认是fdatasync(详情可参看博文)我这里主要说明为什么会提供选项:O_DIRECT。这个选项告诉os,InnoDB在读写数据的时候都不经过os的缓存,因为刚才说过InnoDB会维护自己的缓存buffer

pool,如果还使用os的缓存那么两者就会有一定的重复。在前面参考的文章里面说O_DIRECT对大量随即读写有效率提升,顺序读写则会下降。所以根据自己的需求来定,不过如果你的MySQL用在是OLTP上,基本上选择O_DIRECT没错。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/138444.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • python初级:基础知识学习-循环、列表、元组、集合、字典

    python初级:基础知识学习-循环、列表、元组、集合、字典

    2021年10月6日
    33
  • http_build_query()函数使用方法

    http_build_query()函数使用方法

    2021年11月9日
    50
  • vim 文本编辑器[通俗易懂]

    vim 文本编辑器[通俗易懂]4.2 vim文本编辑器4.2.1 简介vim是vi的升级版,最常见的区别是能用多种颜色显示显示系统文件的一些特殊信息。vi:VisualInterface文本编辑器,可视化接口vim:viiMprove的缩写,即vi的增强版vim编辑器分为三种主要模式:命令模式(编辑模式):默认模式,移动光标,剪切/粘贴文本(界面表现:左下角显示文件名或为空)插入模式(输入模式):修…

    2022年6月7日
    37
  • win10edge启用html5,edge浏览器如何启用flash?win10 Edge浏览器禁用flash方法

    win10edge启用html5,edge浏览器如何启用flash?win10 Edge浏览器禁用flash方法Win10系统中新的默认浏览器Edge已经足够快了,如果想让它更快,可以禁用浏览器里面的Flash动画播放功能来帮助达到更快的上网体验,今天小编就向大家介绍一下Edge浏览器中Flash启用与禁用简单步骤。希望大家会喜欢。win10系统edge浏览器启用和禁用的方法:我们用Windows10的新Edge浏览器打开网页,如果这个网页上有Flash播放的声音、视频内容,在其标签…

    2022年5月12日
    78
  • 实用的谋生技能_unity给人物模型加动作

    实用的谋生技能_unity给人物模型加动作Unity小科普老规矩,先介绍一下Unity的科普小知识:Unity是实时3D互动内容创作和运营平台。包括游戏开发、美术、建筑、汽车设计、影视在内的所有创作者,借助Unity将创意变成现实。Unity平台提供一整套完善的软件解决方案,可用于创作、运营和变现任何实时互动的2D和3D内容,支持平台包括手机、平板电脑、PC、游戏主机、增强现实和虚拟现实设备。也可以简单把Unity理解为一个游戏引擎,可以用来专业制作游戏!…

    2025年11月5日
    3
  • 微信小程序获取openid返回40029的一种错误情况

    微信小程序获取openid返回40029的一种错误情况微信小程序返回40029的情况原因有很多,遇到后大概总结了几个已知的1.小程序里传到后台的code被微信的调用接口使用了两次(只能使用一次)2.appid、AppSecret的值不对(这个自己复制感觉一般不会错)3.自己遇到的最难受的原因:创建项目的appid跟你请求url里的appid、AppSecret不是同一组起因:刚开始学习的时候,自己注册了一个小程序账号,第一个项目用的这…

    2022年6月4日
    47

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号