【js】Mammoth.js的使用:将.docx 文件转换成HTML

【js】Mammoth.js的使用:将.docx 文件转换成HTML将.docx文档转换成HTML。用文档中的语义信息并忽略其他细节来生成简单干净的HTML。不是尝试完成复制样式(字体、大小、颜色等)。APImammoth.convertToHtml(input,options):把源文档转换为HTML文档mammoth.convertToMarkdown(input,options):把源文档转换为Markdown文档。mam…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

  • docx文档预览
  • FileReader 对象
  • Blob对象

只能转换.docx文档,转换过程中复杂样式被忽略。(居中、首行缩进等)
在这里插入图片描述

API

  • mammoth.convertToHtml(input, options) :把源文档转换为 HTML 文档
  • mammoth.convertToMarkdown(input, options) :把源文档转换为 Markdown 文档。
  • mammoth.extractRawText(input) :提取文档的原始文本。这将忽略文档中的所有格式。每个段落后跟两个换行符。

Demo HTML文件

<!DOCTYPE html>
<html lang="en">

<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <meta http-equiv="X-UA-Compatible" content="ie=edge">
    <title>test</title>
</head>

<body>
    <div class="container">
        <input id="document" type="file" />
        <div class="row" style="width: 100%;">
            <div class="span8">
                <div id="output" class="well"></div>
            </div>
        </div>
    </div>

    <script src="https://cdn.bootcss.com/mammoth/1.4.8/mammoth.browser.js"></script>
    <script type="text/javascript">
        document.getElementById("document")
            .addEventListener("change", readFileInputEventAsArrayBuffer, false);

        function displayResult(result) { 
   
            let html = result.value;
            let newHTML = html.replace(//g, '')
            .replace('<h1>', '<h1 style="text-align: center;">')
            .replace(/<table>/g, '<table style="border-collapse: collapse;">')
            .replace(/<tr>/g, '<tr style="height: 30px;">')
            .replace(/<td>/g, '<td style="border: 1px solid pink;">')
            .replace(/<p>/g, '<p style="text-indent: 2em;">');
            document.getElementById("output").innerHTML = newHTML;
        }

        function readFileInputEventAsArrayBuffer(event) { 
   
            var file = event.target.files[0];
            var reader = new FileReader();

            reader.onload = function (loadEvent) { 
   
                var arrayBuffer = loadEvent.target.result;//arrayBuffer 
                mammoth.convertToHtml({ 
    arrayBuffer: arrayBuffer })
                    .then(displayResult)
                    .done();
            };

            reader.readAsArrayBuffer(file);
        }
    </script>
</body>

</html>

Jetbrains全家桶1年46,售后保障稳定

项目中的应用:
后端返回二进制。

var xhr = new XMLHttpRequest();
xhr.open(
    "GET",
    `${ 
     url}/web/showWordDownload?companyId=${ 
     that.companyId}`
);
xhr.responseType = "arraybuffer";
xhr.onload = function (e) { 
   
    let content = xhr.response;
    let blob = new Blob([content], { 
    type: "application/pdf" });
    
    let reader = new FileReader();
	reader.readAsArrayBuffer(blob);
    reader.onload = function (loadEvent) { 
   
    	var arrayBuffer = xhr.response; //arrayBuffer

    	mammoth
        	.convertToHtml({ 
    arrayBuffer: arrayBuffer })
        	.then(displayResult)
        	.done();
    };
    
    function displayResult(result) { 
   
        document.getElementById("output").innerHTML =result.value;
    }
};
 xhr.send();

FileReader对象

FileReader对象,可以读取计算机本地文件 或数据缓冲 进行处理。
创建对象 : let reader = new FileReader();

方法 描述
readAsArrayBuffer(file) 异步按字节读取文件内容,结果用ArrayBuffer对象表示。简单理解为存放了一段二进制数据的内存空间
readAsBinaryString(file) 异步按字节读取文件内容,结果为文件的二进制串
readAsDataURL(file) 结果用data:url的字符串形式表示【base64编码后输出】
事件 描述
onload 读取成功完成时调用

使用:

let input = document.getElementById('input');
input.onchange = function(){ 
   
	let file = this.files[0];
	let reader = new FileReader();
	reader.readAsArrayBuffer(file);
	reader.onload = function(){ 
   
		//读取完成
		console.log(this.result);// this.result 为结果
	}
}

应用场景:
1.在线预览本地文件。(图片 readerAsDataURL)
2、二进制数据上传。
input【type=“file”】
readAsArrayBuffer => xhr 将读取的结果发给后端。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/227298.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 解决SQLyog连接MySQL8时报错:错误号码2058

    解决SQLyog连接MySQL8时报错:错误号码2058远在天边,近在眼前。

    2022年10月23日
    0
  • 自动驾驶(四十七)———超声波雷达简介「建议收藏」

    自动驾驶(四十七)———超声波雷达简介「建议收藏」超声波雷达听着很陌生,但其实一直被广泛使用在倒车上,与毫米波雷达不同的是:超声波能被任何材质的障碍物反射,毫米波只能被金属物体反射,超声波雷达的探测距离又很近,到底工作原理是什么,下面我带大家一起来来看看。1.工作原理超声波雷达的工作原理是通过超声波发射装置向外发出超声波,到通过接收器接收到发送过来超声波时的时间差来测算距离。常用探头的工作频率有40kHz,…

    2022年9月11日
    0
  • FPGA与CPLD的区别

    FPGA与CPLD的区别CPLD和FPGA两者的区别CPLD和FPGA都是我们经常会用到的器件。有的说有配置芯片的是FPGA,没有的是CPLD;有的说逻辑资源多的是FPGA,少的是CPLD;有的直接就不做区分,把他们都叫做FPGA。那么两者到底有什么区别呢?下面我们就以Altera公司的CPLD和FPGA为例来说说两者的区别。首先我们看一下CPLD的芯片结构,搞清楚CPLD是由哪几部分组成的。下图是MAX系…

    2022年5月4日
    44
  • python中main的含义及用法_python main函数有什么用

    python中main的含义及用法_python main函数有什么用原博文2020-03-2720:25−**什么场景下会有main函数?**当该python脚本被作为模块(module)引入(import)时,其中的main()函数将不会被执行。**main函数的作用?**__name__==’__main__’是Python的main函数入口。并非说,加入这句才能使用pythonxxx…相关推荐2019-12-1922:31−Pyt…

    2022年10月9日
    0
  • maven 项目打jar包 并包含所有依赖「建议收藏」

    maven 项目打jar包 并包含所有依赖「建议收藏」背景:基于最近项目部署,需要打jar包,然后涉及接口调用,反复测试,出现了各种问题,最后找到合理方案,特做以下总结:一、延伸知识:Springboot打jar包命令1.把之前打过的包通通干掉mvnpackageclean-Dmaven.test.skip=true2.重新打包mvnpackage-Dmaven.test.skip=true3.Springboot的打包插件<build><plugins>&

    2022年6月19日
    80
  • 本地phpstudy开发中apache可以用,nginx不可用,

    本地phpstudy开发中apache可以用,nginx不可用,

    2021年10月12日
    39

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号