神经网络的可能原理—还原论的振子力学系统(验证实例二分类minst 0,9)

神经网络的可能原理—还原论的振子力学系统(验证实例二分类minst 0,9)由相同的玻色子系集组成的力学系统等效于由一组振子组成的力学系统 这两个系统恰恰是从两种不同观点来看待的同一个系统 它使光的波动理论与微粒理论的統一得以实现 假设神经网络系统相当于振子系统 制作玻色子力学系统与制作振子力学系统是同一个问题 如果神经网络是谐振子那同时也可以看作是一种玻色子 假设一个场景如图按照公式可以得到如果 a b c 是已知的情况下 ma mb

由相同的玻色子系集组成的力学系统等效于由一组振子组成的力学系统—这两个系统恰恰是从两种不同观点来看待的同一个系统,它使光的波动理论与微粒理论的統一得以实现。①

假设神经网络系统相当于振子系统,制作玻色子力学系统与制作振子力学系统是同一个问题。如果神经网络是谐振子那同时也可以看作是一种玻色子。

假设一个场景

神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

如图 按照公式

神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

可以得到

神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

如果ωa,ωb,ωc是已知的情况下ma,mb,mc是可以求出来的,而图C和图D是等价的。有理由相信如果神经网络符合这组公式应该就可以被看作是可以用谐振子来近似的。

再假设

神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

 

可以得到

神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

只要ω09,ωx0, ωx9是已知的ωx,ω0,ω9就都可以解出来。

现在假设弹簧并联过程就是分类的过程。

让一个二分类的网络模拟这个并联的过程。

制作一个带有1个3*3卷积核网络三层节点数分别是49*30*2的网络,分类minst的0和9,将28*28的图片缩小到9*9,让0向1,0收敛,让9向0,1收敛。将这个网络简写成

d2(minst0,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)

就相当于

A:m09=m0+m9

B:mx0=mx+m0

C:mx9=mx+m9

具体进样顺序

     

δ=0.1

     

初始化权重

     
 

迭代次数

   

minst 0-1

1

判断是否达到收敛

minst 9-1

2

判断是否达到收敛

梯度下降

     

minst 0-2

3

判断是否达到收敛

minst 9-2

4

判断是否达到收敛

梯度下降

     

……

     

minst 0-4999

9997

判断是否达到收敛

minst 9-4999

9998

判断是否达到收敛

梯度下降

     

……

     

如果4999图片内没有达到收敛标准再次从头循环

minst 0-1

9999

判断是否达到收敛

minst 9-1

10000

判断是否达到收敛

梯度下降

     

……

     

每当网路达到收敛标准记录迭代次数和对应的准确率测试结果

将这一过程重复199次

   

δ=0.01

     

     

δ=1e-7

     

 

收敛条件是

神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

if (Math.abs(f2[0]-y[0])< δ  &&  Math.abs(f2[1]-y[1])< δ   )

因为对应每个δ都有一个n与之对应,所以可以得到一条稳定的n(δ)曲线,这条曲线已经在《计算神经网络准确率实例二分类minst0,9》2019-2-8的文中测出来了。

再用同样的办法做另外的两个网络

d2(minstx,0)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)

意思是用同样的网络分类minst的0和一张x图片,让0向1,0收敛,让x向0,1收敛

d2(minstx,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)

意思是用同样的网络分类minst的9和一张x图片,让x向1,0收敛,让9向0,1收敛

这张图片x就是一个9*9的二维数组是固定不变的

double [][]x=new double[9][9];

for(int n=0 ;n<9;n++){

for(int m=0 ;m<9 ;m++){

x[n][m]=((double)(n+1)*(m+1)/100);

}}

 

 神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

相当于让三个对象两两分类,使其中的任何一个都成为其他两个的参照物。

A,B,C分别对应三个网络

d2(minst0,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)

d2(minstx,0)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)

d2(minstx,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)

ωx0,ωx9都可以用实验的办法测出来。未知数ωx,ω0,ω9可以被解出来。

得到的具体数据是

δ

实测ω09

实测ωx0

实测ωx9

计算ωx

计算ω0

计算ω9

0.1

2362.90452

2472.38693

2904.67337

3115.69296

2112.06017

2731.43692

0.01

3377.82412

3167.76382

3803.26633

3510.5585

2909.07317

4183.99025

0.001

4638.89447

4400.33668

4757.46734

4501.15066

4306.00668

5063.23345

1.00E-04

7127.50251

6164.71859

7442.24121

6364.98122

5982.2422

9355.13754

9.00E-05

7156.28643

6342.79899

7431.69849

6532.18998

6168.98039

8847.0741

8.00E-05

7367.8593

6398.79899

7796.70352

6673.71357

6155.28019

9783.06651

7.00E-05

7518.49246

6637.88442

7991.43719

6956.59709

6359.31156

9688.48997

6.00E-05

7833.10553

6804.88945

8491.47739

7223.28744

6451.67759

10801.3082

5.00E-05

8203.9799

7217

8554.46231

7452.14541

7002.79568

10356.4536

4.00E-05

8463.40201

7507.39196

8887.58794

7798.7203

7246.44858

10613.1273

3.00E-05

9201.8392

7946.28643

9326.41206

8026.09448

7868.81273

11570.395

2.00E-05

10848.196

8857.38191

10088.8241

8429.36547

9358.00654

13392.2472

1.00E-05

13375.7136

10095.7136

12178.9648

9550.38505

10746.5733

19920.566

9.00E-06

13466.4121

10820.3769

12143.4774

10097.3698

11724.8624

16320.012

8.00E-06

14629.7236

10830.608

12512.2211

9882.00453

12118.0853

19862.3411

7.00E-06

14828.5377

11451.1809

13638.5327

10875.8035

12128.7434

20861.2315

6.00E-06

15859.3467

11989.7337

13834.804

11039.7143

13236.5305

21109.481

5.00E-06

18927.2362

12050.6683

14346.2513

10568.2732

14405.4861

36179.0406

4.00E-06

19663.6382

13025.0905

15675.0251

11642.0648

15057.1888

36231.5706

3.00E-06

26072.9548

14325.3719

16518.2714

11895.6128

19320.4428

61652.2599

2.00E-06

34811.5477

15382.9698

18210.9548

12484.3622

22163.391

#NUM!

1.00E-06

70131.8543

19339.2412

22626.201

15035.0068

32902.3542

#NUM!

9.00E-07

77841.005

20197.5528

22949.3065

15457.9335

37328.7161

#NUM!

8.00E-07

.04

19328.6583

25960.6131

15664.329

27973.7654

#NUM!

7.00E-07

.583

21669.5729

27226.9849

17117.8607

34370.7668

#NUM!

6.00E-07

.92

23628.8191

29224.6935

18534.3118

38600.6748

#NUM!

5.00E-07

.352

24159.4422

29883.2362

18937.6249

39584.7289

#NUM!

4.00E-07

.131

24202.1357

29714.4925

18887.939

40441.954

#NUM!

3.00E-07

.065

30488.2161

35897.5879

23339.518

56266.811

#NUM!

2.00E-07

.658

35339.0101

44208.5829

27729.8175

57639.8005

#NUM!

1.00E-07

 

41935.7035

61469.5075

#VALUE!

#VALUE!

#VALUE!

#NUM!是由测量误差造成的

 

将计算到的ω0和ω9画成曲线

神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

所以这个网络d2(minst0,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)的迭代次数n可以理解成是由参与分类的对象的频率决定的,n的精确的表达式为

神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

因为ω0和ω9是特征的彼此区分的所以可以被分类。

 

再由质量可以得到方程组

神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

 

所以如果假设mx=1则m0,m9,mx0,mx9,m09都可以解出来得到的数据是

δ

mx

m0

m9

mxo

mx9

m09

0.1

1

2.17619

1.

3.17619

2.

3.

0.01

1

1.

0.

2.

1.

2.

0.001

1

1.092692

0.

2.092692

1.

1.88299

1.00E-04

1

1.

0.

2.

1.

1.

9.00E-05

1

1.12122

0.

2.12122

1.

1.

8.00E-05

1

1.

0.

2.

1.

1.

7.00E-05

1

1.

0.

2.

1.

1.71223

6.00E-05

1

1.2535

0.

2.2535

1.

1.

5.00E-05

1

1.

0.

2.

1.

1.

4.00E-05

1

1.

0.

2.

1.

1.

3.00E-05

1

1.040376

0.

2.040376

1.

1.

2.00E-05

1

0.

0.

1.

1.

1.

1.00E-05

1

0.

0.

1.

1.

1.019619

9.00E-06

1

0.

0.

1.

1.

1.

8.00E-06

1

0.

0.

1.

1.

0.

7.00E-06

1

0.

0.

1.

1.

1.075861

6.00E-06

1

0.

0.

1.

1.

0.

5.00E-06

1

0.

0.085328

1.

1.085328

0.

4.00E-06

1

0.

0.

1.

1.

0.

3.00E-06

1

0.

0.037229

1.

1.037229

0.

2.00E-06

1

0.

#NUM!

1.

#NUM!

#NUM!

1.00E-06

1

0.

#NUM!

1.

#NUM!

#NUM!

9.00E-07

1

0.

#NUM!

1.

#NUM!

#NUM!

8.00E-07

1

0.

#NUM!

1.

#NUM!

#NUM!

7.00E-07

1

0.

#NUM!

1.

#NUM!

#NUM!

6.00E-07

1

0.

#NUM!

1.

#NUM!

#NUM!

5.00E-07

1

0.

#NUM!

1.

#NUM!

#NUM!

4.00E-07

1

0.

#NUM!

1.

#NUM!

#NUM!

3.00E-07

1

0.17206

#NUM!

1.17206

#NUM!

#NUM!

2.00E-07

1

0.

#NUM!

1.

#NUM!

#NUM!

1.00E-07

1

#VALUE!

#VALUE!

#VALUE!

#VALUE!

#VALUE!

 

比较计算出来的m0和m9的曲线

神经网络的可能原理---还原论的振子力学系统(验证实例二分类minst 0,9)

 

这个结果表明被分类对象的质量也是特征分开的。

所以现在已经从数学上证明了将神经网络理解成是振子系统是可能的。很难用弹簧模型理解为什么一组有规则的图片有质量,所以将神经网络系统理解成玻色子系统,这三个网络

d2(minst0,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)

d2(minstx,0)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)

d2(minstx,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)

看起来像是三个微观粒子,mx,m0,m9相互作用生成了另外三个微观粒子,mx0,mx9,m09,当δ=0.1时这个6个粒子的质量分别是

δ

mx

m0

m9

mxo

mx9

m09

0.1

1

2.17619

1.

3.17619

2.

3.

 

mx,m0,m9三个粒子两两作用只产生确定的频率但没有确定的质量,只有三个粒子共同作用的情况下才会获得确定的质量。

 

参考书籍

  • 狄拉克《量子力学原理》

实验数据

学习率 0.1

权重初始化方式

Random rand1 =new Random();

int ti1=rand1.nextInt(98)+1;

int xx=1;

if(ti1%2==0)

{ xx=-1;}

tw[a][b]=xx*((double)ti1/x);

第一层第二层和卷积核的权重的初始化的x分别为1000,1000,200

 

d2(minst0,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)

的数据在《计算神经网络准确率实例二分类minst0,9》2019-2-8已经给出了

d2(minstx,0)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)的数据已经在《神经网络与并联的弹簧》2019-2-2中给出了

d2(minstx,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)的数据

x9

               
                 

f2[0]

f2[1]

迭代次数n

平均准确率p-ave

δ

耗时ms/次

耗时ms/199次

耗时 min/199

最大准确率p-max

0.

0.

17.74372

0.

0.5

755.0804

2.50435

0.

0.

0.

1995.286

0.

0.4

1128.477

3.7428

0.

0.

0.

2269.729

0.

0.3

1172.864

3.

0.

0.

0.

2605.286

0.

0.2

593.2864

1.

0.

0.0

0.

2904.673

0.

0.1

1281.704

4.251

0.

0.00

0.

3803.266

0.

0.01

1454.377

4.8237

0.

7.14E-04

0.

4757.467

0.

0.001

1643.317

5.

0.

6.84E-05

0.

7442.241

0.

1.00E-04

2137.769

7.0

0.

6.28E-05

0.

7431.698

0.

9.00E-05

2127.136

7.055

0.

5.48E-05

0.

7796.704

0.

8.00E-05

2179.347

7.

0.

4.62E-05

0.

7991.437

0.

7.00E-05

2220.698

7.

0.

4.02E-05

0.

8491.477

0.

6.00E-05

2323.256

7.

0.

3.34E-05

0.

8554.462

0.

5.00E-05

2334.352

7.

0.

2.74E-05

0.

8887.588

0.

4.00E-05

1748.241

5.

0.

1.99E-05

0.

9326.412

0.

3.00E-05

2444.322

8.

0.88185

1.33E-05

0.

10088.82

0.

2.00E-05

2557.312

8.48175

0.

6.76E-06

0.

12178.96

0.

1.00E-05

2939.317

9.749

0.

6.11E-06

0.

12143.48

0.

9.00E-06

2932.889

9.

0.

5.51E-06

0.

12512.22

0.

8.00E-06

3008.106

9.

0.

4.69E-06

0.

13638.53

0.

7.00E-06

2961.266

9.

0.

4.03E-06

0.

13834.8

0.

6.00E-06

3233.638

10.7249

0.

3.42E-06

0.

14346.25

0.

5.00E-06

3373.543

11.

0.86727

2.83E-06

0.

15675.03

0.

4.00E-06

3694.774

12.

0.

2.13E-06

0.

16518.27

0.

3.00E-06

3857.106

12.

0.

1.33E-06

0.

18210.95

0.

2.00E-06

3756.452

12.4589

0.

6.87E-07

0.

22626.2

0.

1.00E-06

5255.593

17.

0.

6.11E-07

0.

22949.31

0.

9.00E-07

5065.628

16.

0.

5.44E-07

0.

25960.61

0.

8.00E-07

5595.648

18.5589

0.

4.86E-07

0.

27226.98

0.

7.00E-07

5647.839

18.7321

0.

4.31E-07

0.

29224.69

0.

6.00E-07

6046.739

20.055083

0.

3.62E-07

0.

29883.24

0.

5.00E-07

6089.095

20.

0.

2.80E-07

0.

29714.49

0.

4.00E-07

6126.884

20.3209

0.

2.21E-07

0.

35897.59

0.

3.00E-07

7195.874

23.

0.

1.50E-07

0.

44208.58

0.

2.00E-07

8500.035

28.

0.

7.60E-08

0.

61469.51

0.

1.00E-07

11332.24

37.

0.86174

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/199554.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月20日 下午12:44
下一篇 2026年3月20日 下午12:44


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号