groupby函数详解

groupby函数详解pandas中groupby函数用法详解1groupby()核心用法2groupby()语法格式3groupby()参数说明4groupby()典型范例1groupby()核心用法(1)根据DataFrame本身的某一列或多列内容进行分组聚合,(a)若按某一列聚合,则新DataFrame将根据某一列的内容分为不同的维度进行拆解,同时将同一维度的再进行聚合,(b)若按某多列聚合,则新D…

大家好,又见面了,我是你们的朋友全栈君。

计算各列数据总和并作为新列添加到末尾

df['Col_sum'] = df.apply(lambda x: x.sum(), axis=1)

计算指定列下每行数据的总和并作为新列添加到末尾

 df_sf['item_sum'] = df_sf.loc[:,['item_1','item_2','item_3']].apply(lambda x:x.sum(),axis=1)   #'item_sum'列计算'item_1','item_2','item_3'三列的总和

计算各行数据总和并作为新行添加到末尾

df.loc['Row_sum'] = df.apply(lambda x: x.sum())

计算指定列下各行数据总和并作为新行添加到末尾

MT_fs.loc['总计']=MT_fs.loc[:,['发货量','签收量','激活量','首充']].apply(lambda x: x.sum())  #“总计”表示新增行的“index”


Table1 groupby()的常见用法

函数 适用场景 备注
df.groupby(‘key1’) 一列聚合 分组键为列名(可以是字符串、数字或其他Python对象)
df.groupby([‘key1’,‘key2’]) 多列聚合 分组键为列名引入列表list[]
df[‘data1’].groupby(df[‘key1’]).mean() 按某一列进行一重聚合求均值 分组键为Series
A=df[‘订单编号’].groupby([ df[‘运营商’], df[‘分类’], df[‘百度圣卡’] ]).count() 按某一列进行多重聚合计数 分组键为Series引入列表list[]
df[‘data1’].groupby([states,years]).mean() 分组键与原df无关,而是另外指定的任何长度适当的数组 分组键是数组,state和year均为数组

备注:

grouped=df['data1'].groupby(df['key1'])    #聚合后不适用配合函数的输出为:<pandas.core.groupby.generic.SeriesGroupBy object at 0x000001FE3D1FE5C0>

这是由于变量grouped是一个GroupBy对象,它实际上还没有进行任何计算,只是含有一些有关分组键df[‘key1’]的中间数据而已,然后我们可以调用配合函数(如:.mean()方法)来计算分组平均值等。
  因此,一般为方便起见可直接在聚合之后+“配合函数”,默认情况下,所有数值列都将会被聚合,虽然有时可能会被过滤为一个子集
  一般,如果对df直接聚合时,
df.groupby([df['key1'],df['key2']]).mean()分组键为:Series)与df.groupby(['key1','key2']).mean()分组键为:列名)是等价的,输出结果相同。
  但是,如果对df的指定列进行聚合时,
df['data1'].groupby(df['key1']).mean()分组键为:Series),唯一方式。
此时,直接使用“列名”作分组键,提示“Error Key”。
   注意:分组键中的任何缺失值都会被排除在结果之外。

1 groupby()核心用法

(1)根据DataFrame本身的某一列或多列内容进行分组聚合,(a)若按某一列聚合,则新DataFrame将根据某一列的内容分为不同的维度进行拆解,同时将同一维度的再进行聚合,(b)若按某多列聚合,则新DataFrame将是多列之间维度的笛卡尔积,即:新DataFrame具有一个层次化索引(由唯一的键对组成),例如:“key1”列,有a和b两个维度,而“key2”有one和two两个维度,则按“key1”列和“key2”聚合之后,新DataFrame将有四个group;
注意:groupby默认是在axis=0上进行分组的,通过设置axis=1,也可以在其他任何轴上进行分组。

(2)groupby(),根据分组键的不同,有以下4种聚合方法:

  • 分组键为Series
    (a)使用原df的子列作为Series
    df.groupby([ df[‘key1’], df[‘key2’] ]).mean()
    (b)使用自定义的Series
    mapping={‘a’:‘red’,‘b’:‘red’,‘c’:‘blue’,‘d’:‘blue’,‘e’:‘red’,‘f’:‘orange’}
    map_series=pd.Series(mapping)
    people.groupby(map_series,axis=1).count()
  • 分组键为列名
    df.groupby([ ‘key1’,‘key2’ ]).mean()
  • 分组键为数组
    states=np.array([‘Ohio’, ‘California’, ‘California’, ‘Ohio’, ‘Ohio’])
    years=np.array([2004,2005,2006,2005,2006]) #自定义数组
    df[‘data1’].groupby( [ states,years ] ).mean()
  • 分组键为字典
    mapping={‘a’:‘red’,‘b’:‘red’,‘c’:‘blue’,‘d’:‘blue’,‘e’:‘red’,‘f’:‘orange’} #自定义字典
    by_column=people.groupby(mapping,axis=1).sum() #指定axis=1,表示对列数据进行聚合分组
  • 分组键为函数
    例如:传入len函数(可以求取一个字符串长度数组),实现根据字符串的长度进行分组
    people.groupby(len).sum() #将字符串长度相同的行进行求和
  • 分组键为函数和数组、列表、字典、Series的组合
    引入列表list[ ] 将函数跟数组、列表、字典、Series混合使用作为分组键进行聚合,因为任何东西最终都会被转换为数组
    key_list=[‘one’,‘one’,‘one’,‘two’,‘two’] #自定义列表,默认列表顺序和df的列顺序一致
    people.groupby([ len,key_list ]).min()
  • 分组键为具有多重列索引df 的列索引层次
    hier_df.groupby(level=‘cty’,axis=1).count() #利用参数level,指明聚合的层级
    (3)常用配合函数/方法
  1. 打印出按某一指定列进行聚合的DataFrame:
for i in df.groupby('key1'):
    print(i)
  1. 按某一指定列进行聚合的DataFrame:


Table1 groupby()的配合函数

函数 适用场景 备注
.mean() 均值
.count() 计数
.min() 最小值
.mean().unstack() 求均值,聚合表的层次索引不堆叠
.size() 计算分组大小 GroupBy的size方法,将返回一个含有分组大小的Series
.apply()
.agg()

(4)对聚合后的数据片段,进行字典、列表等格式转化

  • 将数据片段转为字典
pieces=pieces=dict(list(df.groupby('key1')))
  • 将数据片段转为列表
pieces=list(df.groupby('key1'))

(5)利用groupby,根据dtypes对列进行分组,此时需指定axis=1,否则,groupby默认根据axis=0进行分组,而行数据由于类型不统一,故无法根据dtypes对列进行分组,结果为空。
(6)可使用一个/组列名,或者一个/组字符串数组对由DataFrame产生的GroupBy对象,进行索引,从而实现选取部分列进行聚合的目的即:

1)根据key1键对data1列数据聚合
df.groupby('key1')['data1'].mean()
#或者
df['data1'].groupby(df['key1']).mean()    #或者df['data1'].groupby([df['key1']]).mean() ,当按多个层次聚合时引入列表,故单层次用列表也无妨
>>>
key1
a    -0.048502
b     0.053162
Name: data1, dtype: float64
(2)根据key1键对data2列数据聚合
df.groupby('key1')['data2'].mean()
#或者
df['data2'].groupby(df['key1']).mean()
>>>
key1
a     -0.533444
b     -0.948798
Name: data2, dtype: float64
(3)根据key1键对data2列数据聚合,当对多列数据如data1和data2根据某个键入key1聚合分组时,组引入列表['data1','data2'],此处对data2外加中括号是一个意思,只是影响输出格式。
df.groupby('key1')[['data2']].mean()
#或者df[['data2']].groupby(df['key1']).mean()
>>>
	 data2
key1	
a	-0.533444
b	-0.9487984)根据key1键对data1和data2列数据聚合
df.groupby('key1')[['data1','data2']].mean()
#或者
df[['data1','data2']].groupby(df['key1']).mean()
>>>
	   data1	data2
key1		
a	 -0.048502	-0.533444
b	  0.053162	-0.9487985)根据多个键key1、key2对data2列数据聚合
df.groupby(['key1','key2'])['data2'].mean()
#或者
df['data2'].groupby([df['key1'],df['key2']]).mean()
>>>
key1  key2
a     one    -1.391653
      two     1.182974
b     one    -1.707349
      two    -0.190247
Name: data2, dtype: float64

2 groupby()语法格式

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs)

3 groupby()参数说明

by : mapping, function, label, or list of labels
Used to determine the groups for the groupby. If by is a function, it’s called on each value of the object’s index. If a dict or Series is passed, the Series or dict VALUES will be used to determine the groups (the Series’ values are first aligned; see .align() method). If an ndarray is passed, the values are used as-is determine the groups. A label or list of labels may be passed to group by the columns in self. Notice that a tuple is interpreted a (single) key.

axis : {0 or ‘index’, 1 or ‘columns’}, default 0
Split along rows (0) or columns (1).

level : int, level name, or sequence of such, default None
If the axis is a MultiIndex (hierarchical), group by a particular level or levels.

as_index : bool, default True
For aggregated output, return object with group labels as the index. Only relevant for DataFrame input. as_index=False is effectively “SQL-style” grouped output.

sort : bool, default True
Sort group keys. Get better performance by turning this off. Note this does not influence the order of observations within each group. Groupby preserves the order of rows within each group.

group_keys : bool, default True
When calling apply, add group keys to index to identify pieces.

squeeze : bool, default False
Reduce the dimensionality of the return type if possible, otherwise return a consistent type.

observed : bool, default False
This only applies if any of the groupers are Categoricals. If True: only show observed values for categorical groupers. If False: show all values for categorical groupers.

New in version 0.23.0.

**kwargs
Optional, only accepts keyword argument ‘mutated’ and is passed to groupby.

4 groupby()典型范例

范例一:根据DataFrame本身的某一列或多列内容进行分组聚合

#创建原始数据集
import pandas as pd
import numpy as np

df=pd.DataFrame({ 
   'key1':['a','a','b','b','a'],
                 'key2':['one','two','one','two','one'],
                  'data1':np.random.randn(5),
                  'data2':np.random.randn(5)})
#'key1':['a','a','b','b','a']亦可写作'key1':list('aabba'),完成列表的创建
>>> df
   key1	 key2	    data1	  data2
0	a	 one	  -0.484689	  -3.105627
1	a	 two	  0.033929	  1.182974
2	b	 one	  1.067201	  -1.707349
3	b	 two	  -0.960876	  -0.190247
4	a	 one	  0.305254	  0.322322
#(1)按指定的某一列进行聚合
for i in df.groupby('key1'):
    print(i)
>>>
('a',   key1   key2     data1      data2
0        a     one     -0.484689   -3.105627
1        a     two     0.033929    1.182974
4        a     one     0.305254    0.322322)
('b',   key1   key2     data1      data2
2        b     one     1.067201    -1.707349
3        b     two     -0.960876   -0.190247)
#(2)按多列进行聚合,新的DataFrame是多列之间维度的笛卡尔积
for i in df.groupby(['key1','key2']):
    print(i)
>>>
(('a', 'one'),   key1    key2     data1      data2
      0          a       one      -0.484689  -3.105627
      4          a       one      0.305254   0.322322)
(('a', 'two'),   key1    key2     data1     data2
      1          a       two      0.033929   1.182974)
(('b', 'one'),   key1    key2     data1     data2
      2          b       one      1.067201 -1.707349)
(('b', 'two'),   key1   key2     data1     data2
      3          b       two      -0.960876 -0.190247)
#(3) 按key1进行分组,并计算data1列的平均值
df1=df['data1'].groupby(df['key1']).mean()
>>>
key1
a       -0.048502
b       0.053162
#(4) 按key1、key2进行分组,并计算data1列的平均值,聚合表不堆叠
#将数据从“花括号”格式转为“表格”格式,unstack即“不要堆叠”
df2=df['data1'].groupby([df['key1'],df['key2']]).mean().unstack()
>>>df2
key2	one	        two
key1		
a	    -0.089718	 0.033929
b	    1.067201	 -0.960876
#(5)分组键可以是与原df无关的,另外指定的任何长度适当的数组,新数组按列表顺序分别与df[col_1]的数据一一对应。
states=np.array(['Ohio', 'California', 'California', 'Ohio', 'Ohio'])
years=np.array([2004,2005,2006,2005,2006])
df['data1'].groupby([states,years]).mean()
>>>
California  2005    0.033929
            2006    1.067201
Ohio        2004   -0.484689
            2005   -0.960876
            2006    0.305254
#用到GroupBy的size方法,它可以返回一个含有分组大小的Series
df.groupby(['key1','key2']).size()
>>>
      key1  key2
a     one     2
      two     1
b     one     1
      two     1

范例二:利用for循环,对分组进行迭代

#原始数据集与范例一相同
#对一列聚合,使用for循环进行分组迭代
for name,group in df.groupby('key1'):
    print(name)
    print(group)
>>>
a
  key1 key2     data1     data2
0    a  one -0.484689 -3.105627
1    a  two  0.033929  1.182974
4    a  one  0.305254  0.322322
b
  key1 key2     data1     data2
2    b  one  1.067201 -1.707349
3    b  two -0.960876 -0.190247
#若仅使用一个变量name,会影响输出结果的索引层次表达方式,且结果为元组
for name in df.groupby('key1'):
    print(name)
>>>
('a',   key1 key2     data1     data2
0    a  one -0.484689 -3.105627
1    a  two  0.033929  1.182974
4    a  one  0.305254  0.322322)
('b',   key1 key2     data1     data2
2    b  one  1.067201 -1.707349
3    b  two -0.960876 -0.190247)
#对于多重键的情况,元组的第一个元素将会是由键值组成的元组,所以for循环的第一个变量用元组(k1,k2):
for (k1,k2),group in df.groupby(['key1','key2']):
    print(k1,k2)
    print(group)
>>>
a one
  key1 key2     data1     data2
0    a  one -0.484689 -3.105627
4    a  one  0.305254  0.322322
a two
  key1 key2     data1     data2
1    a  two  0.033929  1.182974
b one
  key1 key2     data1     data2
2    b  one  1.067201 -1.707349
b two
  key1 key2     data1     data2
3    b  two -0.960876 -0.190247
#对于多重键的情况,若for循环的第一个变量不用元组(k1,k2),而是普通变量name,则输出结果的层次索引将为元组格式
for name,group in df.groupby(['key1','key2']):
    print(name)
    print(group)
>>>
('a', 'one')
  key1 key2     data1     data2
0    a  one -0.484689 -3.105627
4    a  one  0.305254  0.322322
('a', 'two')
  key1 key2     data1     data2
1    a  two  0.033929  1.182974
('b', 'one')
  key1 key2     data1     data2
2    b  one  1.067201 -1.707349
('b', 'two')
  key1 key2     data1     data2
3    b  two -0.960876 -0.190247

范例三:对聚合后的数据片段,进行格式类型转化

#将数据片段转为字典
pieces=dict(list(df.groupby('key1')))
>>>
pieces
{ 
   'a':   key1  key2     data1     data2
 0       a   one     -0.484689 -3.105627
 1       a   two      0.033929  1.182974
 4       a   one      0.305254  0.322322, 'b':   key1 key2     data1     data2
 2       b   one      1.067201 -1.707349
 3       b   two     -0.960876 -0.190247}
 >>>
 pieces['b']    #选取片段
    key1	key2	data1	    data2
2	b	    one	    1.067201	-1.707349
3	b	    two	    -0.960876	-0.190247
#将数据片段转为列表
pieces=list(df.groupby('key1'))
>>>
pieces
[('a',   key1 key2     data1     data2
  0       a   one     -0.484689 -3.105627
  1       a   two      0.033929  1.182974
  4       a   one      0.305254  0.322322), ('b',   key1 key2     data1     data2
  2       b   one      1.067201 -1.707349
  3       b   two     -0.960876 -0.190247)]

范例四:利用groupby,根据dtypes对列进行分组,此时,需指定axis=1,否则,groupby默认根据axis=0进行分组,而行数据由于类型不统一,故无法根据dtypes对列进行分组

#df.dtypes用于确定df的数据类型
df.dtypes
>>>
key1      object
key2      object
data1    float64
data2    float64
dtype: object
#将聚合后df转化为字典格式,后根据df的数据类型对列进行分组
grouped=df.groupby(df.dtypes,axis=1)
dict(list(grouped))
>>>
{ 
   dtype('float64'):       data1     data2
                      0 -0.484689 -3.105627
                      1  0.033929  1.182974
                      2  1.067201 -1.707349
                      3 -0.960876 -0.190247
                      4  0.305254  0.322322, dtype('O'):   key1  key2
                                                       0    a   one
                                                       1    a   two
                                                       2    b   one
                                                       3    b   two
                                                       4    a   one}
#若不指定axis=1,则默认groupby根据行数据按dtypes进行分组
grouped1=df.groupby(df.dtypes)
dict(list(grouped1))
>>>
{ 
   }    #由于行数据不统一,故按dtypes分组时,为空
#将聚合数据片段转化为list类型
list(grouped)
>>>
[(dtype('float64'),       data1     data2
                       0  -0.484689 -3.105627
                       1   0.033929  1.182974
                       2   1.067201 -1.707349
                       3  -0.960876 -0.190247
                       4   0.305254  0.322322), (dtype('O'),    key1  key2
                                                             0    a  one
                                                             1    a  two
                                                             2    b  one
                                                             3    b  two
                                                             4    a  one)]
                                                             

范例五:根据自定义字典、自定义列表、自定义Series、函数或者函数与自定义数组、列表、字典、Series的组合,作为分组键进行聚合

#创建原始数据集
people=pd.DataFrame(np.random.randn(5,5),columns=list('abcde'),index=['Joe','Steve','Wes','Jim','Travis'])
people
>>>
            a	        b	        c	       d	       e
Joe 	-0.350379	-2.216265	-1.922898	0.655574	0.512573
Steve	-1.212107	-1.040184	-0.659978	-0.277454	0.613489
Wes	    -1.624845	-0.432863	-0.211577	0.310541	2.138030
Jim	     2.038365	-0.237121	-0.392664	-0.480918	1.566855
Travis	-0.345361	-0.653787	-0.299217	1.019871	0.511216
#利用people.ix[2:3,['b','c']]=np.nan,将第2,3行,第b,c列的数据置为空
people.ix[2:3,['b','c']]=np.nan
>>>
people
            a	        b	        c	       d	      e
Joe	    -0.350379	-2.216265	-1.922898	 0.655574	0.512573
Steve	-1.212107	-1.040184	-0.659978	-0.277454	0.613489
Wes	    -1.624845	   NaN	       NaN	     0.310541	2.138030
Jim	     2.038365	-0.237121	-0.392664	-0.480918	1.566855
Travis	-0.345361	-0.653787	-0.299217	 1.019871	0.511216
# 假设已知列的分组关系,并希望根据分组计算列的总计:
#创建分组的映射字典
mapping={ 
   'a':'red','b':'red','c':'blue','d':'blue','e':'red','f':'orange'}
mapping
>>>
{ 
   'a': 'red', 'b': 'red', 'c': 'blue', 'd': 'blue', 'e': 'red', 'f': 'orange'}
type(mapping)
>>>
dict
#将这个字典传给groupby即可,由于是按列进行分组,指定axis=1
by_column=people.groupby(mapping,axis=1).sum()
by_column
>>>
	        blue	red
Joe	       -1.267323	-2.054071
Steve	   -0.937431	-1.638802
Wes	        0.310541	 0.513184
Jim	       -0.873581	 3.368099
Travis	    0.720653	-0.487932
#用自定义Series作为分组键进行聚合,则pandas会检查Series以确保其索引跟分组轴是对齐的
#自定义Series作为分组键
map_series=pd.Series(mapping)
>>>
map_series
a       red
b       red
c      blue
d      blue
e       red
f    orange
dtype: object
#用自定义Series作为分组键聚合
people.groupby(map_series,axis=1).count()
>>>
       blue	red
Joe	    2	3
Steve	2	3
Wes	    1	2
Jim	    2	3
Travis	2	3
#用函数作分组键,进行分组,需传入len函数(可以求取一个字符串长度数组),实现根据人名的长度进行分组
people.groupby(len).sum()   #将名字长度相同的行求和
>>>
        a	        b	         c	        d	       e
3	0.063140	-2.453386	-2.315561	0.485198	4.217458
5	-1.212107	-1.040184	-0.659978	-0.277454	0.613489
6	-0.345361	-0.653787	-0.299217	1.019871	0.511216
#将函数和数组、列表、字典、Series组合作为分组键,进行聚合
key_list=['one','one','one','two','two']   #自定义列表,默认列表的字符串顺序和df的列顺序一致
people.groupby([len,key_list]).min()
>>>
             a	        b	        c	        d	       e
3	one	 -1.624845	-2.216265	-1.922898	0.310541	0.512573
    two	  2.038365	-0.237121	-0.392664	-0.480918	1.566855
5	one	 -1.212107	-1.040184	-0.659978	-0.277454	0.613489
6	two	 -0.345361	-0.653787	-0.299217	1.019871	0.511216

范例六:df含有多重列索引的聚合分组

#根据df的多重列索引的层次级别分组聚合
#自定义列层次索引
columns=pd.MultiIndex.from_arrays([['US','US','US','JP','JP'],[1,3,5,1,3]],names=['cty','tenor'])
>>>
columns
MultiIndex(levels=[['JP', 'US'], [1, 3, 5]],
           codes=[[1, 1, 1, 0, 0], [0, 1, 2, 0, 1]],
           names=['cty', 'tenor'])
#创建包含多重列索引的原始数据集
hier_df=pd.DataFrame(np.random.randn(4,5),columns=columns)
>>>
hier_df
cty	    US	        JP
tenor	  1	          3	         5	         1	        3
0	  0.023254	 -0.271758	-0.129695	-1.003850	0.600698
1	  -0.076856	 0.696218	-1.054670	-0.232982	0.641908
2	  0.211017	 0.481233	-0.289600	0.794614	-0.910464
3	  1.069144	 0.358034	0.169202	-1.910069	0.769219
#按列索引层次进行分组聚合
hier_df.groupby(level='cty',axis=1).count()    #利用参数level,指明聚合的层级
>>>
cty	JP	US
0	2	3
1	2	3
2	2	3
3	2	3
#"盲投"DataFrame按照“号码归属省”对指定4列“'发货量','签收量','激活量','首充'”进行聚合
functions=['count']
MT_fs_grouped=MT_data.groupby(['号码归属省'])
MT_fs=MT_fs_grouped['发货量','签收量','激活量','首充'].agg(functions)
MT_fs=pd.DataFrame(MT_fs)
MT_fs.reset_index(inplace=True)   #将聚合表的index转为普通列
#对聚合表增加“各列统计求和”的行,同时指定参与求和的列,即“号码归属省”列需排除;
MT_fs.loc['总计']=MT_fs.loc[:,['发货量','签收量','激活量','首充']].apply(lambda x: x.sum())
MT_fs.loc['总计',['号码归属省']]='总计'  #补全“省份”最后一行的“总计”名称

参考链接:https://www.cnblogs.com/huiyang865/p/5577772.html

5 groupby常见的调用函数

  • 描述组内数据的基本统计量:A.groupby("性别").describe().unstack()
  • 组内均值计算:A.groupby("性别").mean()
  • 我们还可以一次运用多个函数计算:A.groupby( ["班级","性别"]).agg([np.sum, np.mean, np.std]) # 一次计算了三个
  • 按照【生日】的【年份】进行分组,看看有多少人是同龄?
    A[“生日”] = pd.to_datetime(A[“生日”],format =”%Y/%m/%d”) # 转化为时间格式
    A.groupby(A["生日"].apply(lambda x:x.year)).count() # 按照【生日】的【年份】分组
    在这里插入图片描述

参考链接:python中groupby函数主要的作用是进行数据的分组以及分组后地组内运算!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/141098.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • linux之管道

    1.进程间通信概述进程是一个独立的资源分配单元,不同进程之间的资源是独立的,没有关联,不能在一个进程中直接访问另一个进程的资源。进程不是孤立的,不同的进程需要进行信息的交互和状态的传递等,因此需要

    2021年12月28日
    56
  • SpringFramework5.0 @Indexed注解 简单解析

    纸上得来终觉浅 绝知此事要躬行 —陆游最近在看SpringBoot核编程思想(核心篇),看到走向注解驱动编程这章,里面有讲解到:在SpringFramework5.0引入了一个注解@Indexed ,它可以为Spring的模式注解添加索引,以提升应用启动性能。官网地址:Spring Framework 5.1.12.RELEASE beans-scanning-index…

    2022年2月28日
    39
  • 常见SQL面试题_sql索引面试题

    常见SQL面试题_sql索引面试题之前面试遇到一个sql题。当时没写出sql语句,把题目记下。现在分享给大家(知识贵在精,学会举一反三)。这里采用的是mysql.sql语句如下。DROPTABLEIFEXISTS`depart_month`;CREATETABLE`depart_month`(`id`int(11)NOTNULLAUTO_INCREMENT,//id自增长`depa…

    2022年8月29日
    4
  • 运行react项目命令(react项目怎么启动)

    进入目录,按住shift键,在此处打开命令窗口输入:npmstart会弹出localhost:3000,的浏览器窗口打包项目:npmrunbuild

    2022年4月12日
    1.2K
  • redis memcache 区别_缓存redis的五种方式

    redis memcache 区别_缓存redis的五种方式Redis的作者SalvatoreSanfilippo曾经对这两种基于内存的数据存储系统进行过比较:1.Redis支持服务器端的数据操作:Redis相比Memcached来说,拥有更多的数据结构和并支持更丰富的数据操作,通常在Memcached里,你需要将数据拿到客户端来进行类似的修改再set回去。这大大增加了网络IO的次数和数据体积。在Redis中,这些复杂的操作通常和一般的GET/SET一…

    2025年5月22日
    3
  • mysql fsync_mysql fsync

    mysql fsync_mysql fsync标签:1介绍数据库系统从诞生那天开始,就面对一个很棘手的问题,fsync的性能问题。组提交(groupcommit)就是为了解决fsync的问题。最近,遇到一个业务反映MySQL创建分区表很慢,仔细分析了一下,发现InnoDB在创建表的时候有很多fsync——每个文件会有4个fsync的调用。当然,并不每个fsync的开销都很大。这里引出几个问题:(1)问题1:为什么fsync开销相对都比较大…

    2022年5月6日
    51

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号