由相同的玻色子系集组成的力学系统等效于由一组振子组成的力学系统—这两个系统恰恰是从两种不同观点来看待的同一个系统,它使光的波动理论与微粒理论的統一得以实现。①
假设神经网络系统相当于振子系统,制作玻色子力学系统与制作振子力学系统是同一个问题。如果神经网络是谐振子那同时也可以看作是一种玻色子。
假设一个场景

如图 按照公式

可以得到

如果ωa,ωb,ωc是已知的情况下ma,mb,mc是可以求出来的,而图C和图D是等价的。有理由相信如果神经网络符合这组公式应该就可以被看作是可以用谐振子来近似的。
再假设

可以得到

只要ω09,ωx0, ωx9是已知的ωx,ω0,ω9就都可以解出来。
现在假设弹簧并联过程就是分类的过程。
让一个二分类的网络模拟这个并联的过程。
制作一个带有1个3*3卷积核网络三层节点数分别是49*30*2的网络,分类minst的0和9,将28*28的图片缩小到9*9,让0向1,0收敛,让9向0,1收敛。将这个网络简写成
d2(minst0,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
就相当于
A:m09=m0+m9
B:mx0=mx+m0
C:mx9=mx+m9
|
具体进样顺序 |
|||
|
δ=0.1 |
|||
|
初始化权重 |
|||
|
迭代次数 |
|||
|
minst 0-1 |
1 |
判断是否达到收敛 |
|
|
minst 9-1 |
2 |
判断是否达到收敛 |
|
|
梯度下降 |
|||
|
minst 0-2 |
3 |
判断是否达到收敛 |
|
|
minst 9-2 |
4 |
判断是否达到收敛 |
|
|
梯度下降 |
|||
|
…… |
|||
|
minst 0-4999 |
9997 |
判断是否达到收敛 |
|
|
minst 9-4999 |
9998 |
判断是否达到收敛 |
|
|
梯度下降 |
|||
|
…… |
|||
|
如果4999图片内没有达到收敛标准再次从头循环 |
|||
|
minst 0-1 |
9999 |
判断是否达到收敛 |
|
|
minst 9-1 |
10000 |
判断是否达到收敛 |
|
|
梯度下降 |
|||
|
…… |
|||
|
每当网路达到收敛标准记录迭代次数和对应的准确率测试结果 |
|||
|
将这一过程重复199次 |
|||
|
δ=0.01 |
|||
|
… |
|||
|
δ=1e-7 |
|||
收敛条件是

if (Math.abs(f2[0]-y[0])< δ && Math.abs(f2[1]-y[1])< δ )
因为对应每个δ都有一个n与之对应,所以可以得到一条稳定的n(δ)曲线,这条曲线已经在《计算神经网络准确率实例二分类minst0,9》2019-2-8的文中测出来了。
再用同样的办法做另外的两个网络
d2(minstx,0)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
意思是用同样的网络分类minst的0和一张x图片,让0向1,0收敛,让x向0,1收敛
d2(minstx,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
意思是用同样的网络分类minst的9和一张x图片,让x向1,0收敛,让9向0,1收敛
这张图片x就是一个9*9的二维数组是固定不变的
double [][]x=new double[9][9];
for(int n=0 ;n<9;n++){
for(int m=0 ;m<9 ;m++){
x[n][m]=((double)(n+1)*(m+1)/100);
}}

相当于让三个对象两两分类,使其中的任何一个都成为其他两个的参照物。
A,B,C分别对应三个网络
d2(minst0,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
d2(minstx,0)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
d2(minstx,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
ωx0,ωx9都可以用实验的办法测出来。未知数ωx,ω0,ω9可以被解出来。
得到的具体数据是
|
δ |
实测ω09 |
实测ωx0 |
实测ωx9 |
计算ωx |
计算ω0 |
计算ω9 |
|
0.1 |
2362.90452 |
2472.38693 |
2904.67337 |
3115.69296 |
2112.06017 |
2731.43692 |
|
0.01 |
3377.82412 |
3167.76382 |
3803.26633 |
3510.5585 |
2909.07317 |
4183.99025 |
|
0.001 |
4638.89447 |
4400.33668 |
4757.46734 |
4501.15066 |
4306.00668 |
5063.23345 |
|
1.00E-04 |
7127.50251 |
6164.71859 |
7442.24121 |
6364.98122 |
5982.2422 |
9355.13754 |
|
9.00E-05 |
7156.28643 |
6342.79899 |
7431.69849 |
6532.18998 |
6168.98039 |
8847.0741 |
|
8.00E-05 |
7367.8593 |
6398.79899 |
7796.70352 |
6673.71357 |
6155.28019 |
9783.06651 |
|
7.00E-05 |
7518.49246 |
6637.88442 |
7991.43719 |
6956.59709 |
6359.31156 |
9688.48997 |
|
6.00E-05 |
7833.10553 |
6804.88945 |
8491.47739 |
7223.28744 |
6451.67759 |
10801.3082 |
|
5.00E-05 |
8203.9799 |
7217 |
8554.46231 |
7452.14541 |
7002.79568 |
10356.4536 |
|
4.00E-05 |
8463.40201 |
7507.39196 |
8887.58794 |
7798.7203 |
7246.44858 |
10613.1273 |
|
3.00E-05 |
9201.8392 |
7946.28643 |
9326.41206 |
8026.09448 |
7868.81273 |
11570.395 |
|
2.00E-05 |
10848.196 |
8857.38191 |
10088.8241 |
8429.36547 |
9358.00654 |
13392.2472 |
|
1.00E-05 |
13375.7136 |
10095.7136 |
12178.9648 |
9550.38505 |
10746.5733 |
19920.566 |
|
9.00E-06 |
13466.4121 |
10820.3769 |
12143.4774 |
10097.3698 |
11724.8624 |
16320.012 |
|
8.00E-06 |
14629.7236 |
10830.608 |
12512.2211 |
9882.00453 |
12118.0853 |
19862.3411 |
|
7.00E-06 |
14828.5377 |
11451.1809 |
13638.5327 |
10875.8035 |
12128.7434 |
20861.2315 |
|
6.00E-06 |
15859.3467 |
11989.7337 |
13834.804 |
11039.7143 |
13236.5305 |
21109.481 |
|
5.00E-06 |
18927.2362 |
12050.6683 |
14346.2513 |
10568.2732 |
14405.4861 |
36179.0406 |
|
4.00E-06 |
19663.6382 |
13025.0905 |
15675.0251 |
11642.0648 |
15057.1888 |
36231.5706 |
|
3.00E-06 |
26072.9548 |
14325.3719 |
16518.2714 |
11895.6128 |
19320.4428 |
61652.2599 |
|
2.00E-06 |
34811.5477 |
15382.9698 |
18210.9548 |
12484.3622 |
22163.391 |
#NUM! |
|
1.00E-06 |
70131.8543 |
19339.2412 |
22626.201 |
15035.0068 |
32902.3542 |
#NUM! |
|
9.00E-07 |
77841.005 |
20197.5528 |
22949.3065 |
15457.9335 |
37328.7161 |
#NUM! |
|
8.00E-07 |
.04 |
19328.6583 |
25960.6131 |
15664.329 |
27973.7654 |
#NUM! |
|
7.00E-07 |
.583 |
21669.5729 |
27226.9849 |
17117.8607 |
34370.7668 |
#NUM! |
|
6.00E-07 |
.92 |
23628.8191 |
29224.6935 |
18534.3118 |
38600.6748 |
#NUM! |
|
5.00E-07 |
.352 |
24159.4422 |
29883.2362 |
18937.6249 |
39584.7289 |
#NUM! |
|
4.00E-07 |
.131 |
24202.1357 |
29714.4925 |
18887.939 |
40441.954 |
#NUM! |
|
3.00E-07 |
.065 |
30488.2161 |
35897.5879 |
23339.518 |
56266.811 |
#NUM! |
|
2.00E-07 |
.658 |
35339.0101 |
44208.5829 |
27729.8175 |
57639.8005 |
#NUM! |
|
1.00E-07 |
|
41935.7035 |
61469.5075 |
#VALUE! |
#VALUE! |
#VALUE! |
#NUM!是由测量误差造成的
将计算到的ω0和ω9画成曲线

所以这个网络d2(minst0,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)的迭代次数n可以理解成是由参与分类的对象的频率决定的,n的精确的表达式为

因为ω0和ω9是特征的彼此区分的所以可以被分类。
再由质量可以得到方程组

所以如果假设mx=1则m0,m9,mx0,mx9,m09都可以解出来得到的数据是
|
δ |
mx |
m0 |
m9 |
mxo |
mx9 |
m09 |
|
0.1 |
1 |
2.17619 |
1. |
3.17619 |
2. |
3. |
|
0.01 |
1 |
1. |
0. |
2. |
1. |
2. |
|
0.001 |
1 |
1.092692 |
0. |
2.092692 |
1. |
1.88299 |
|
1.00E-04 |
1 |
1. |
0. |
2. |
1. |
1. |
|
9.00E-05 |
1 |
1.12122 |
0. |
2.12122 |
1. |
1. |
|
8.00E-05 |
1 |
1. |
0. |
2. |
1. |
1. |
|
7.00E-05 |
1 |
1. |
0. |
2. |
1. |
1.71223 |
|
6.00E-05 |
1 |
1.2535 |
0. |
2.2535 |
1. |
1. |
|
5.00E-05 |
1 |
1. |
0. |
2. |
1. |
1. |
|
4.00E-05 |
1 |
1. |
0. |
2. |
1. |
1. |
|
3.00E-05 |
1 |
1.040376 |
0. |
2.040376 |
1. |
1. |
|
2.00E-05 |
1 |
0. |
0. |
1. |
1. |
1. |
|
1.00E-05 |
1 |
0. |
0. |
1. |
1. |
1.019619 |
|
9.00E-06 |
1 |
0. |
0. |
1. |
1. |
1. |
|
8.00E-06 |
1 |
0. |
0. |
1. |
1. |
0. |
|
7.00E-06 |
1 |
0. |
0. |
1. |
1. |
1.075861 |
|
6.00E-06 |
1 |
0. |
0. |
1. |
1. |
0. |
|
5.00E-06 |
1 |
0. |
0.085328 |
1. |
1.085328 |
0. |
|
4.00E-06 |
1 |
0. |
0. |
1. |
1. |
0. |
|
3.00E-06 |
1 |
0. |
0.037229 |
1. |
1.037229 |
0. |
|
2.00E-06 |
1 |
0. |
#NUM! |
1. |
#NUM! |
#NUM! |
|
1.00E-06 |
1 |
0. |
#NUM! |
1. |
#NUM! |
#NUM! |
|
9.00E-07 |
1 |
0. |
#NUM! |
1. |
#NUM! |
#NUM! |
|
8.00E-07 |
1 |
0. |
#NUM! |
1. |
#NUM! |
#NUM! |
|
7.00E-07 |
1 |
0. |
#NUM! |
1. |
#NUM! |
#NUM! |
|
6.00E-07 |
1 |
0. |
#NUM! |
1. |
#NUM! |
#NUM! |
|
5.00E-07 |
1 |
0. |
#NUM! |
1. |
#NUM! |
#NUM! |
|
4.00E-07 |
1 |
0. |
#NUM! |
1. |
#NUM! |
#NUM! |
|
3.00E-07 |
1 |
0.17206 |
#NUM! |
1.17206 |
#NUM! |
#NUM! |
|
2.00E-07 |
1 |
0. |
#NUM! |
1. |
#NUM! |
#NUM! |
|
1.00E-07 |
1 |
#VALUE! |
#VALUE! |
#VALUE! |
#VALUE! |
#VALUE! |
比较计算出来的m0和m9的曲线

这个结果表明被分类对象的质量也是特征分开的。
所以现在已经从数学上证明了将神经网络理解成是振子系统是可能的。很难用弹簧模型理解为什么一组有规则的图片有质量,所以将神经网络系统理解成玻色子系统,这三个网络
d2(minst0,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
d2(minstx,0)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
d2(minstx,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
看起来像是三个微观粒子,mx,m0,m9相互作用生成了另外三个微观粒子,mx0,mx9,m09,当δ=0.1时这个6个粒子的质量分别是
|
δ |
mx |
m0 |
m9 |
mxo |
mx9 |
m09 |
|
0.1 |
1 |
2.17619 |
1. |
3.17619 |
2. |
3. |
mx,m0,m9三个粒子两两作用只产生确定的频率但没有确定的质量,只有三个粒子共同作用的情况下才会获得确定的质量。
参考书籍
- 狄拉克《量子力学原理》
|
实验数据 |
|
学习率 0.1 |
|
权重初始化方式 |
|
Random rand1 =new Random(); |
|
int ti1=rand1.nextInt(98)+1; |
|
int xx=1; |
|
if(ti1%2==0) |
|
{ xx=-1;} |
|
tw[a][b]=xx*((double)ti1/x); |
|
第一层第二层和卷积核的权重的初始化的x分别为1000,1000,200 |
d2(minst0,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)
的数据在《计算神经网络准确率实例二分类minst0,9》2019-2-8已经给出了
d2(minstx,0)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)的数据已经在《神经网络与并联的弹簧》2019-2-2中给出了
d2(minstx,9)81-con(3*3)49-30-2-(2*k) ,k∈(0,1)的数据
|
x9 |
||||||||
|
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时 min/199 |
最大准确率p-max |
|
0. |
0. |
17.74372 |
0. |
0.5 |
755.0804 |
|
2.50435 |
0. |
|
0. |
0. |
1995.286 |
0. |
0.4 |
1128.477 |
|
3.7428 |
0. |
|
0. |
0. |
2269.729 |
0. |
0.3 |
1172.864 |
|
3. |
0. |
|
0. |
0. |
2605.286 |
0. |
0.2 |
593.2864 |
|
1. |
0. |
|
0.0 |
0. |
2904.673 |
0. |
0.1 |
1281.704 |
|
4.251 |
0. |
|
0.00 |
0. |
3803.266 |
0. |
0.01 |
1454.377 |
|
4.8237 |
0. |
|
7.14E-04 |
0. |
4757.467 |
0. |
0.001 |
1643.317 |
|
5. |
0. |
|
6.84E-05 |
0. |
7442.241 |
0. |
1.00E-04 |
2137.769 |
|
7.0 |
0. |
|
6.28E-05 |
0. |
7431.698 |
0. |
9.00E-05 |
2127.136 |
|
7.055 |
0. |
|
5.48E-05 |
0. |
7796.704 |
0. |
8.00E-05 |
2179.347 |
|
7. |
0. |
|
4.62E-05 |
0. |
7991.437 |
0. |
7.00E-05 |
2220.698 |
|
7. |
0. |
|
4.02E-05 |
0. |
8491.477 |
0. |
6.00E-05 |
2323.256 |
|
7. |
0. |
|
3.34E-05 |
0. |
8554.462 |
0. |
5.00E-05 |
2334.352 |
|
7. |
0. |
|
2.74E-05 |
0. |
8887.588 |
0. |
4.00E-05 |
1748.241 |
|
5. |
0. |
|
1.99E-05 |
0. |
9326.412 |
0. |
3.00E-05 |
2444.322 |
|
8. |
0.88185 |
|
1.33E-05 |
0. |
10088.82 |
0. |
2.00E-05 |
2557.312 |
|
8.48175 |
0. |
|
6.76E-06 |
0. |
12178.96 |
0. |
1.00E-05 |
2939.317 |
|
9.749 |
0. |
|
6.11E-06 |
0. |
12143.48 |
0. |
9.00E-06 |
2932.889 |
|
9. |
0. |
|
5.51E-06 |
0. |
12512.22 |
0. |
8.00E-06 |
3008.106 |
|
9. |
0. |
|
4.69E-06 |
0. |
13638.53 |
0. |
7.00E-06 |
2961.266 |
|
9. |
0. |
|
4.03E-06 |
0. |
13834.8 |
0. |
6.00E-06 |
3233.638 |
|
10.7249 |
0. |
|
3.42E-06 |
0. |
14346.25 |
0. |
5.00E-06 |
3373.543 |
|
11. |
0.86727 |
|
2.83E-06 |
0. |
15675.03 |
0. |
4.00E-06 |
3694.774 |
|
12. |
0. |
|
2.13E-06 |
0. |
16518.27 |
0. |
3.00E-06 |
3857.106 |
|
12. |
0. |
|
1.33E-06 |
0. |
18210.95 |
0. |
2.00E-06 |
3756.452 |
|
12.4589 |
0. |
|
6.87E-07 |
0. |
22626.2 |
0. |
1.00E-06 |
5255.593 |
|
17. |
0. |
|
6.11E-07 |
0. |
22949.31 |
0. |
9.00E-07 |
5065.628 |
|
16. |
0. |
|
5.44E-07 |
0. |
25960.61 |
0. |
8.00E-07 |
5595.648 |
|
18.5589 |
0. |
|
4.86E-07 |
0. |
27226.98 |
0. |
7.00E-07 |
5647.839 |
|
18.7321 |
0. |
|
4.31E-07 |
0. |
29224.69 |
0. |
6.00E-07 |
6046.739 |
|
20.055083 |
0. |
|
3.62E-07 |
0. |
29883.24 |
0. |
5.00E-07 |
6089.095 |
|
20. |
0. |
|
2.80E-07 |
0. |
29714.49 |
0. |
4.00E-07 |
6126.884 |
|
20.3209 |
0. |
|
2.21E-07 |
0. |
35897.59 |
0. |
3.00E-07 |
7195.874 |
|
23. |
0. |
|
1.50E-07 |
0. |
44208.58 |
0. |
2.00E-07 |
8500.035 |
|
28. |
0. |
|
7.60E-08 |
0. |
61469.51 |
0. |
1.00E-07 |
11332.24 |
|
37. |
0.86174 |
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/199554.html原文链接:https://javaforall.net
