解决java中html转word文档,转成功后的word文档在断网情况下无法显示图片问题「建议收藏」

解决java中html转word文档,转成功后的word文档在断网情况下无法显示图片问题「建议收藏」解决java中html转word文档,转成功后的word文档在断网情况下无法显示图片问题

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

         前一段时间遇到一个问题,就是将html转成word文档,里面有图片,表格,和各种形式的文字。刚开始的做法是将html代码取出来,然后以留的形式进行保存,后缀名为.doc。当我转成之后发现一切完美,但是图片出现了问题:

        1.图片大小、像素有问题。

       2.(最严重的)图片存在word的是一个链接而已。

       当我们在断网的情况下(或者拷贝到两一台电脑上)打开word文档的时候 实际上看到的图片是一个链接,也就是说图片转化的不成功。

      其实从本质上来说,我们可以看一下转化之后所谓的word文档的格式,(点击另存为,看文件类型)发现其实转化之后的文档的文件类型仍然是.html的格式。只有当我们再次另存为并且选择文件类型为.doc格式的时候 才能做到真正意义上的转化,并且图片不会出现上述问题。原因大致是html转word的时候中间会经过一步处理,先将html的文件转成了xml文件,然后在转成.doc格式,同时将html的图片转成了Base64编码的格式(替换了图片的链接)存在了xml文件里。(我们可以打开将任意一篇.doc格式的word文档另存为成.xml文档后分析带有图片的那部分代码。)

      于是乎浏览网上各种大神的解决办法,发现并没有一个很好的解决方法。网上的关于html转化word的解决办法总结起来有以下几种情况:

       1.用ASPOSE.WORDS控件来处理。(涉及到了asp。。还有神马控件。。扩展性太差,,果断不深入这个方法。废弃之。)

       2.把html文件里面的图片转成Base64格式存储。

       好像是涉及到了上面所叙述的html转word的原理部分,但是那是word做的事,鬼知道当我们在选择将word另存为.doc格式的时候word做了什么操作。。。。我们都知道html标签里的图片形式为:<img src=”xxxxxxx” />  将图片转成Base64编码容易,但是并不是将Base64编码的图片简单的放到src=“xxxxx”里面就行了,需要能让word读懂。  转成能让word读懂的格式就更不容易了(也就是前文提到的那个xml文件)。因为图片有很多格式(.jpg/.png等等),还要涉及到word里特殊的标签(类似这种<img src=“data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAADIA…” />)。。。。 所以在尝试了之后也放弃了。

      3.用POI 这个jar包 

说这个的更是扯。 Apache的POI对图片的处理不友好,甚至有的版本根本就不支持。在入坑很久之后,果断放弃。。。

      4. javacdoc 的包  

        亲测 不可以。以上4中方法是网上讨论最多的,我从09年的帖子一直翻到17年的,总结下来的。。发现并没有找到解决办法。。最后不得已,决定自己解析html文档,转化word。最终成功转化,实现了自己想要的结果。实现起来也很简单,只是解析了一下word而已。

      5.利用freemaker模板。

      这个可以解决,但是要大动干戈。实际开发的过程中不会因为一点问题就换模板的。这样不利于开发和维护。

解决思路:

      设法解决转成word的时候另存为时候看到的文件类型不是.html格式的就ok,这样的话就不会以图片链接的形式放在word里面。

解决办法:(相关demo和jar包后面会给出)

     1.先 用jsoup的包将html格式化。(此处用于解析html代码。方便后面用itext包调用)

     2.利用iText的jar包,这个jar包是转化pdf用到的,但是转化成word也能用。保存后在word里面的文件类型是.rtf格式的。能够完美解决问题。

成功后的结果:

   解决java中html转word文档,转成功后的word文档在断网情况下无法显示图片问题「建议收藏」

文件类型:

      解决java中html转word文档,转成功后的word文档在断网情况下无法显示图片问题「建议收藏」


Demo地址: 

http://download.csdn.net/download/wht21888/10120532

(年少无为,卖码为生,需要一点点资源币。委屈   具体的方式在Demo里有,有什么问题或者你有更好的方式  欢迎加QQ:749938275 一起讨论)

    

     





     



版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/182968.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • rider激活码【最新永久激活】

    (rider激活码)好多小伙伴总是说激活码老是失效,太麻烦,关注/收藏全栈君太难教程,2021永久激活的方法等着你。IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.html40Z9P7H9NN-eyJsaWNlbnNlSW…

    2022年3月28日
    608
  • 阿里云运维架构实践秘籍

    阿里云运维架构实践秘籍中国互联网发展编年史、运维、不同云盘单路随机写访问响应时间对比、常见数据库性能对比、常见衡量业务量级别指标、如何根据PV估算服务器数量?、不同业务特性计算模型、PV量和服务器配置/RDS配置对应表、服务器CPU/内存配置模型、云盘空间选择、宽带的选择、共享文件存储的方法、OSS文件管理、OSS数据迁移、缓存、Session管理六种策略、分库分表、云迁移步骤、监控方案、运维的发展阶段、传统运维痛点、云服务供应商排行、黑客常见入侵步骤、架构阶段、云端运维安全、黑客常见系统层攻击

    2022年7月17日
    11
  • AJAX常见面试问题[通俗易懂]

    AJAX常见面试问题[通俗易懂]1.工作当中会和后台交互吗? 那你能说说封装好的ajax里的几个参数吗 ?url: 发送请求的地址。type:请求方式(post或get)默认为get。async:同步异步请求,默认true所有请求均为异步请求。timeout:超时时间设置,单位毫秒data:要求为Object或String类型的参数,发送到服务器的数据cache:默认为true(当dataType为script时,…

    2022年8月25日
    3
  • PureMVC与MVC框架

    PureMVC与MVC框架一 定义 全名 ModelViewCon 模型 视图 控制器的缩写 一种软件的典范 将逻辑数据界面分离的代码组织方法 二 PureMVCCoreS 核心文件 View cs IView cs Controller cs IController cs 3 Model cs IModel cs 三 PureMVC 优缺点 1 利用中介者 代理者 命令实现解耦 使得 Model View Controller 之间耦合性降低 提升了部

    2025年6月1日
    0
  • FFM模型详解[通俗易懂]

    FFM模型详解[通俗易懂]FM和FFM模型是最近几年提出的模型,凭借其在数据量比较大并且特征稀疏的情况下,仍然能够得到优秀的性能和效果的特性,屡次在各大公司举办的CTR预估比赛中获得不错的战绩。美团点评技术团队在搭建DSP的过程中,探索并使用了FM和FFM模型进行CTR和CVR预估,并且取得了不错的效果。本文旨在把我们对FM和FFM原理的探索和应用的经验介绍给有兴趣的读者。文章参考:【1】文章目录1.FFM模型原理2.FFM模型实现3.FFM模型应用1.FFM模型原理假设一个广告分类的问题,根据用户和广告位相关的.

    2022年6月7日
    76
  • 简述JVM垃圾回收机制

    简述JVM垃圾回收机制1.Java中的四种引用类型在Java中,对于引用最基本的解释就是:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用(有点指针的意味)。后来Java还将引用划分为了4种,根据被GC回收的时机可以分为:强引用(StrongReference)、软引用(SoftReference)、弱引用(WeakReference)、虚引用(Phantor

    2022年6月11日
    27

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号