fpga流水线设计思想_fpga视频容易入门

fpga流水线设计思想_fpga视频容易入门流水线设计的思想来源是高流量,也就是说时间延迟固定的情况下尽可能的产生高的流量,使得整体的信号传输速率得到提升。这一概念我是最早在《高级FPGA设计——结构、实现和优化》(SteveKilts)一书中接触到的。作者在书中提到,高流量设计的抽象术语就是“流水线”。作者指出:流水线设计的优越性是新数据在前面的数据完成之前就可以进行处理。并给出一个例子,硬件实现计算一个数的三次方。这给出设计代码,用于下文分析比较。1.类似于软件的递归算法实现(非流水线结构)`timescale1ns/

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

流水线设计的思想来源是高流量,也就是说时间延迟固定的情况下尽可能的产生高的流量,使得整体的信号传输速率得到提升。

这一概念我是最早在《高级FPGA设计——结构、实现和优化》(Steve Kilts)一书中接触到的。作者在书中提到,高流量设计的抽象术语就是“流水线”。

作者指出:流水线设计的优越性是新数据在前面的数据完成之前就可以进行处理。并给出一个例子,硬件实现计算一个数的三次方。

这给出设计代码,用于下文分析比较。

1.类似于软件的递归算法实现(非流水线结构)

`timescale 1ns / 1ps
//
// Company: 
// Engineer: 
// 
// Create Date: 2022/01/21 15:59:20
// Design Name: 
// Module Name: test
// Project Name: 
// Target Devices: 
// Tool Versions: 
// Description: 
// 
// Dependencies: 实现计算一个数的三次方,采用非流水线的方式
// 
// Revision:
// Revision 0.01 - File Created
// Additional Comments:
// 
//

module power3(
output reg [7:0]  XPower,
output            finished,
input       [7:0] X,
input             clk, start     //the duration of start is  a single clock
);    

reg [7:0] ncount;

assign finished=(ncount==0);

always@(posedge clk)
 if (start) begin 
    XPower <=X;
    ncount<=2;
 end
 else if (!finished)  begin 
      ncount<=ncount-1;
      XPower <=XPower*X;

end

endmodule 

2.流水线结构

module power3(
   output  reg  [7:0] XPower,
   input               clk,
   input         [7:0] X 
);

reg   [7:0]  XPower1, XPower2;
reg   [7:0]  X1, X2;

//两级流水操作
always@(posedge clk) begin
// Pipeline stage 1
    X1     <= X;
    XPower1<= X;
// Pipeline stage 2
    X2     <= X1;
    XPower2<= XPower1*X1;
//  Pipeline stage 3 
    XPower<= XPower2*X2;
end
endmodule

有了设计代码,下面就是比较分析,在硬件层面上究竟两者有啥区别呢?速度?占用资源?是否有差别呢?

在vivado中将两者综合并分析比较。

fpga流水线设计思想_fpga视频容易入门

图一:非流水线设计RTL连线图

fpga流水线设计思想_fpga视频容易入门

图二:非流水线设计资源报告

fpga流水线设计思想_fpga视频容易入门

图三:流水线设计RTL连线图

fpga流水线设计思想_fpga视频容易入门

图四:流水线设计资源报告

比较1:可以看到,非流水线设计中存在较多组合逻辑,而触发器和乘法单元相对较少;在流水线设计中,触发器和乘法单元用的更多。这是不是所谓的“面积”上的区别

fpga流水线设计思想_fpga视频容易入门

图五:非流水线设计时序报告

fpga流水线设计思想_fpga视频容易入门

 图六:流水线设计时序报告

比较2:可以看到,在相同的时钟约束下,流水线设计所能达到的最大频率更高(1/(4+0.185)),也就是速度更快。

这是我们通过综合工具得出的结论,Steve Kilts在书中用更抽象的参数描述了两者的区别。

非流水设计:

流量=8/3,或者2.7位/时钟

时滞=3时钟

时序=关键路径中的一个乘法延时

流水设计:

流量=8/1,或者8位/时钟

时滞=3时钟

时序=关键路径中的一个乘法延时

个人思考:

那么这上述流量判定的依据是什么呢?一开始我也困惑,后来慢慢体会给出了自己的思考。

在非流水设计中,最终的输出须等到三次运算都完成后,才能输出,所以输出8位数据需要3个时钟周期,而在流水设计中呢?

我们回到开头“流水线设计的优越性是新数据在前面的数据完成之前就可以进行处理”,抓住“新”一词,其中应强调数据的变化性,就能体会到流水线设计的特征。当数据变化时,在最后一级处理的同时“新数据”已经在处理了,只需“再”一个时钟周期,8位的“新”数据又可以输出了,所有此时流量为8/1。

这里强调数据变化,若是数据不变,或者在第一个数据处理时,流水线的这种优越性将很难让人体会的到。

那么流水线处理的本质依据是什么呢?答案是FPGA的并行性。这一点在Donald G.Bailey 的《基于FPGA的嵌入式图像处理系统设计》中提到过。作者指出,流水性设计,就是将系统整体操作拆解成若干操作步骤进行处理。我们可以看出,上述三次乘方计算中,就是将其拆解成X*X*X来处理。

综合起来,我们可以得出这样的结论:流水线设计单个模块而言,由于插入了若干级寄存器,使得

其时钟频率增加;对于系统级设计而言,流水线设计又能减少模块间的传输延迟。

所以,流水线设计用起来吧!下一步研究怎么样应用吧。

我是fpga小白,写博客只为分享和记录。

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/170396.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 通俗理解kaggle比赛大杀器xgboost

    通俗理解kaggle比赛大杀器xgboost通俗理解kaggle比赛大杀器xgboost说明:若出现部分图片无法正常显示而影响阅读,请以此处的文章为准:xgboost题库版。时间:二零一九年三月二十五日。0前言xgboost一直在竞赛江湖里被传为神器,比如时不时某个kaggle/天池比赛中,某人用xgboost于千军万马中斩获冠军。而我们的机器学习课…

    2022年4月27日
    42
  • 在web page中使鼠标右击失效的几种方法「建议收藏」

    在web page中使鼠标右击失效的几种方法

    2022年1月26日
    44
  • printwriter用法_printwriter设置编码

    printwriter用法_printwriter设置编码PrintWriter的使用java.io.PrintWriter具有自动行刷新的缓冲字符输出流,特点是可以按行写出字符串,并且可以自动行刷新。java.io.BufferedWriter是缓冲字符输出流,内部有缓冲区可以进行块写操作提供效率,而PrintWriter就是通过连接它实现的缓冲功能(PW的很多构造方法内部自动连接它)。PW支持两个直接对文件写操作的构造方法:*…

    2022年8月10日
    13
  • WebGame开发总结

    WebGame开发总结项目基本情况:  服务器端采用c++和c#混合开发,网络层采用c++开发,业务逻辑用c#开发。客户端采用silverlight。数据库采用mysql。GM工具用Asp.net,GM工具盒服务器通讯用wcf,基本把微软的东西都用遍了。  服务器端在开始的时候,使用了某位同事之前开发的一款服务器端引擎,改引擎曾经开源但现在基本不再更新。引擎地址:http://mmorpg.codeplex.com/  这款引擎在使用上只满足了部分需求,再加上原作者又跳槽,引擎基本是我在维护和改进,不过基本上都往里面

    2022年5月2日
    53
  • pycharm下的多个python版本共存(一)

    pycharm下的多个python版本共存(一)

    2021年10月22日
    64
  • springcloudfeign原理面试题_微服务feign作用

    springcloudfeign原理面试题_微服务feign作用Feign原理简述启动时,程序会进行包扫描,扫描所有包下所有@FeignClient注解的类,并将这些类注入到spring的IOC容器中。当定义的Feign中的接口被调用时,通过JDK的动态代理来生成RequestTemplate。 RequestTemplate中包含请求的所有信息,如请求参数,请求URL等。 RequestTemplate声明Request,然后将Request交给cl…

    2022年9月26日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号