统计机器学习-Multinoulli分布、多项式分布

统计机器学习-Multinoulli分布、多项式分布Multinoulli分布(多元伯努利分布):模型:       Mu(p)Mu(p)Mu(p)       d面????获得每一面的概率: p1,p2,…,pdp_1,p_2,…,p_dp1​,p2​,…,pd​分布函数:p(x∣p)=∏k=1dpkxkp(x|p)=\prod_{k=1}^dp_k^{x_k}p(x∣p)=k=1∏d​pkxk​​E(X)=pE(X)=pE(…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

Multinoulli分布(多元伯努利分布):

模型:        M u ( p ) Mu(p) Mu(p)

        d面?获得每一面的概率:  p 1 , p 2 , . . . , p d p_1,p_2,…,p_d p1,p2,...,pd

分布函数:
p ( x ∣ p ) = ∏ k = 1 d p k x k p(x|p)=\prod_{k=1}^d p_k^{x_k} p(xp)=k=1dpkxk
E ( X ) = p E(X)=p E(X)=p
似然函数:
L = l o g ( ∏ n = 1 N ∏ k = 1 d p k x n k ) = l o g ( ∏ k = 1 d p k m k ) L=log(\prod_{n=1}^N \prod_{k=1}^d p_k^{x_{nk}})=log( \prod_{k=1}^d p_k^{m_k}) L=log(n=1Nk=1dpkxnk)=log(k=1dpkmk) m k = ∑ n x n k m_k=\sum_n x_{nk} mk=nxnk
极大似然估计:
L = l n ( ∏ n = 1 → N ∏ k = 1 → d p k x n k ) = l n ( ∏ k = 1 → d p k m k ) = ∑ k = 1 → d m k l n p k + λ ( ∑ k = 1 → d p k − 1 ) L = ln(\prod^{n=1\to N}\prod^{k=1\to d}p_k^{x_{nk}}) = ln(\prod^{k=1\to d}p_k^{m_k}) = \sum^{k=1\to d}m_k lnp_k+\lambda(\sum^{k=1\to d}p_k-1) L=ln(n=1Nk=1dpkxnk)=ln(k=1dpkmk)=k=1dmklnpk+λ(k=1dpk1)
               p k = m k λ p_k=\frac{m_k}{\lambda} pk=λmk    λ = − N \lambda=-N λ=N

其中    λ ( ∑ k = 1 d p k − 1 ) \lambda(\sum_{k=1}^{d}p_k-1) λ(k=1dpk1)   的由来
是因为    ∑ k = 1 d p k = 1 \sum_{k=1}^d p_k =1 k=1dpk=1   ,
(概率密度函数和为1),在做极大似然估计时候,必须满足这一条件。对于带有约束的优化问题,常用拉格朗日乘子法,   λ > 0 \lambda>0 λ>0  表示拉格朗日乘数,表示约束条件的强度。

多项式分布:

模型:        M u l t ( n , p ) Mult(n,p) Mult(n,p)
        d面?获得每一面的概率:  p 1 , p 2 , . . . , p d p_1,p_2,…,p_d p1,p2,...,pd
        掷了n次,每面出现的次数: ( x 1 , x 2 , . . . , x d ) (x_1,x_2,…,x_d) (x1,x2,...,xd)
        满足条件: x 1 + x 2 + . . . + x d = n x_1+x_2+…+x_d=n x1+x2+...+xd=n
              x i ≥ 0 x_i≥0 xi0
分布函数:
C n x 1 C n − x 1 x 2 . . . C n − x 1 − x 2 + . . . x d − 1 x d p 1 x 1 . . . p d x d C_n^{x_1}C_{n-x_1}^{x_2}…C_{n-x_1-x_2+…x_{d-1}}^{x_d}p_1^{x_1}…p_d^{x_d} Cnx1Cnx1x2...Cnx1x2+...xd1xdp1x1...pdxd
f ( x ) = n ! x ( 1 ) ! . . . x ( d ) ! ( p 1 ) x ( 1 ) . . . ( p d ) x ( d ) f(x)=\frac{n!}{x^{(1)}!…x^{(d)}!}(p_1)^{x^{(1)}}…(p_d)^{x^{(d)}} f(x)=x(1)!...x(d)!n!(p1)x(1)...(pd)x(d)
多项式展开定理:
( p 1 + . . . + p d ) n = ∑ x ∈ Δ d , n n ! x ( 1 ) ! . . . x ( d ) ! ( p 1 ) x ( 1 ) . . . ( p d ) x ( d ) (p_1+…+p_d)^n=\sum_{x∈ \Delta d,n}\frac{n!}{x^{(1)}!…x^{(d)}!}(p_1)^{x^{(1)}}…(p_d)^{x^{(d)}} (p1+...+pd)n=xΔd,nx(1)!...x(d)!n!(p1)x(1)...(pd)x(d)
矩生成函数:
在这里插入图片描述
E ( x j ) = n p j E(x^j)=np_j E(xj)=npj
C o v [ x ( j ) , x ( j ′ ) ] = { n p j ( 1 − p j )                            ( j = j ′ ) − n p j p j ′                                   ( j ≠ j ′ ) Cov[x^{(j)},x^{(j’)}]= \begin{cases} np_j(1-p_j) \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (j=j’) \\ -np_jp_{j’} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (j≠j’) \end{cases} Cov[x(j),x(j)]={
npj(1pj)                          (j=j)npjpj                                 (j=j)

在这里插入图片描述

一个服从多项式分布的例子:

在这里插入图片描述
将 这 个 基 因 碱 基 序 列 可 视 化 将这个基因碱基序列可视化

Matplotlib:

import xlrd as xl
import numpy as np
from collections import Counter
import matplotlib.pyplot as plt
import pandas as pd

data = xl.open_workbook("等位基因.xlsx")
table = data.sheets()[0]
if data.sheet_loaded(sheet_name_or_index=0):
    cols = table.ncols  # 列数
    lists = [table.col_values(_) for _ in range(cols)]
    list_x = [_ for _ in range(1, len(lists) + 1)]
    list_A = []
    list_G = []
    list_C = []
    list_T = []
    for item in lists:
        dicts = dict(Counter(item))
        list_A.append(dicts.get('A', 0))
        list_G.append(dicts.get('G', 0))
        list_C.append(dicts.get('C', 0))
        list_T.append(dicts.get('T', 0))
    columns = ('A', 'G', 'C', 'T')
    data = []
    data.append(list_A)
    data.append(list_G)
    data.append(list_C)
    data.append(list_T)
    data = np.array(data)
    data = data.T
    df = pd.DataFrame(data, columns=columns, index=[_ for _ in range(1, cols + 1)])
    df.plot(kind='bar', stacked=True,colormap="cool_r",legend="reverse")
    print(df)
    ax=plt.gca()
    ax.spines['right'].set_color('none')
    ax.spines['top'].set_color('none')
    plt.xlabel("Sequence Position")
    plt.ylabel("Bits")
    plt.show()

else:
    print("打开文件失败")

在这里插入图片描述
Pyecharts:

import xlrd as xl
import numpy as np
from pyecharts.charts import *
from collections import Counter
from pyecharts import options as opts
from pyecharts.render import make_snapshot
from snapshot_selenium import snapshot
from pyecharts.globals import ThemeType

data = xl.open_workbook("等位基因.xlsx")
# table=data.sheet_by_name('Sheet1')
# table=data.sheet_by_index(0)
table = data.sheets()[0]
if data.sheet_loaded(sheet_name_or_index=0):
    rows = table.nrows  # 行数
    cols = table.ncols  # 列数
    lists = [table.col_values(_) for _ in range(cols)]
    list_x = [_ for _ in range(1, len(lists) + 1)]
    list_A = []
    list_G = []
    list_C = []
    list_T = []
    for item in lists:
        dicts = dict(Counter(item))
        list_A.append(dicts.get('A', 0))
        list_G.append(dicts.get('G', 0))
        list_C.append(dicts.get('C', 0))
        list_T.append(dicts.get('T', 0))
    bar = (
        Bar(init_opts=opts.InitOpts(theme=ThemeType.LIGHT))
            .add_xaxis(list_x)
            .add_yaxis("A", list_A, stack='stack1')
            .add_yaxis("G", list_G, stack='stack1')
            .add_yaxis("C", list_C, stack='stack1')
            .add_yaxis("T", list_T, stack='stack1')
            .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
            .set_global_opts(title_opts=opts.TitleOpts(pos_left="10%"),
                             yaxis_opts=opts.AxisOpts(name="Bits"),
                             xaxis_opts=opts.AxisOpts(name="Sequence Position")))
    make_snapshot(snapshot, bar.render(), "111.png")
else:
    print("打开文件失败")

在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/183914.html原文链接:https://javaforall.net

(0)
上一篇 2022年8月31日 上午8:36
下一篇 2022年8月31日 上午8:46


相关推荐

  • 永远埋藏我的故事_把你藏进我的回忆

    永远埋藏我的故事_把你藏进我的回忆因为本身大家看来可能就很俗套吧!可是昨天他的一句话,我地动山摇,他还是牺牲了我来成全他的事业!在我没发生这件事情之前,我也很轻描淡写的劝我曾经遇见这样事情的大学同学,可是没想到一向心高气傲的我也会这样不理智,甚至可以说是堕落!      今年我大学毕业,说来很可笑,我现在还是初恋,没遇见他之前我的手都没让男生拉过,借别的系的师兄说的话,我是冷美人,可望不可急。是的,我一直都认为漂亮不是资本,而事业

    2026年1月14日
    5
  • 无锁编程基础[通俗易懂]

    无锁编程基础[通俗易懂]目录文章目录目录背景锁的分类死锁、活锁饥饿、饿死(starvation):优先级反转(Priorityinversion)护航现象(LockConvoys)自旋锁无锁为什么要无锁?(界定问题)如何无锁?(界定问题)CAS等原子操作无锁队列的链表实现ABA问题解决ABA的问题用数组实现无锁队列小结背景我们处在技术快速发展的时代,竞争变得前所未有的激烈,不仅要十八般武艺俱全,还得选对正确的…

    2022年6月10日
    44
  • 重定向是get还是post_请求转发与重定向的异同

    重定向是get还是post_请求转发与重定向的异同一、调用方式 我们知道,在servlet中调用转发、重定向的语句如下:request.getRequestDispatcher(“new.jsp”).forward(request,response);//转发到new.jspresponse.sendRedirect(“new.

    2025年10月5日
    4
  • 插值算法及matlab实现,MATLAB 插值算法实现

    插值算法及matlab实现,MATLAB 插值算法实现1.高斯插值functionf=Gauss(x,y,x0)if(length(x)==length(y))n=length(x);elsedisp(‘x和y的维数不相等!’);return;endxx=linspace(x(1),x(n),(x(2)-x(1)));if(xx~=x)disp(‘节点之间不是等距的!’);return;endif(mod(n,2)==1)if…

    2022年5月31日
    36
  • 基本农田卫星地图查询_别被迷惑了,你手机上的北斗导航App和北斗卫星导航没关系…

    基本农田卫星地图查询_别被迷惑了,你手机上的北斗导航App和北斗卫星导航没关系…澎湃新闻记者王心馨 7 月 31 日 随着北斗三号最后一颗卫星正式组网成功 中国北斗三号全球卫星导航系统全面建成 也正式开启了高质量的全球服务 澎湃新闻 www thepaper cn 注意到 随着北斗导航在民间热度上升 在手机应用端还出现了一款名为北斗导航 高清卫星导航的 App 并且已经登上苹果应用商店免费 App 榜单第一名 霸榜三天 澎湃新闻发现 开发这款应用的公司为深圳逗趣互联科技有限公司 从天眼查

    2026年3月26日
    2
  • mysql乐观锁使用

    mysql乐观锁使用mysql 乐观锁使用一次关于乐观锁的使用记录 仅供参考反例 缺陷 本质上根据 id 更新 版本锁字段 version 字段没有起效没有加事务回滚正例 dao 方法 sql 写法乐观锁扩展

    2026年3月26日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号