markdown导出为html_python html转word

markdown导出为html_python html转word关于前端HTML转换为Markdown,发现了一个非常好用的npm项目:https://sitdown.mdnice.com/zh-hans/首先确保本机已经安装nodejs,并根据下面的文章安装execjs并修改其源码:execjs执行包含中文参数的JavaScripthttps://xxmdmst.blog.csdn.net/article/details/123099139在python所在目录安装sitdown:>npminstallsitdownadded2pac

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

关于前端HTML转换为Markdown,发现了一个非常好用的npm项目:https://sitdown.mdnice.com/zh-hans/

首先确保本机已经安装nodejs,并根据下面的文章安装execjs并修改其源码:

execjs执行包含中文参数的JavaScript
https://xxmdmst.blog.csdn.net/article/details/123099139

python所在目录安装sitdown:

> npm install sitdown

added 2 packages, removed 220 packages, and changed 93 packages in 4s

确保当前目录中已经安装了sitdown(至少存在node_modules目录),我们就可以通过execjs在python中调用了:

import os
import execjs

print(execjs.get().name)
js_code = """var { Sitdown } = require('sitdown'); let sitdown = new Sitdown({ keepFilter: ['style'], codeBlockStyle: 'fenced', bulletListMarker: '-', hr: '---', }); function html2md(data) { return sitdown.HTMLToMD(data) } """

ctx = execjs.compile(js_code)
html = """<div id="write" class=""><blockquote> <p><span>?博客主页:</span><a href="https://blog.csdn.net/as604049322"><span>https://blog.csdn.net/as604049322</span></a></p> <p><span>?欢迎点赞 ? 收藏 ⭐留言 ? 欢迎讨论!</span></p> <p><span>?本文由 </span><strong><span>小小明-代码实体</span></strong><span> 原创,首发于 </span><strong><span>CSDN</span></strong><span>?</span></p> <p><span>?未来很长,值得我们全力奔赴更美好的生活✨</span></p> </blockquote></div>"""

md = ctx.call("html2md", html)
print(md)

结果:

Node.js (V8)
> ?博客主页:[https://blog.csdn.net/as604049322](https://blog.csdn.net/as604049322)
> 
> ?欢迎点赞 ? 收藏 ⭐留言 ? 欢迎讨论!
> 
> ?本文由 **小小明-代码实体** 原创,首发于 **CSDN**?
> 
> ?未来很长,值得我们全力奔赴更美好的生活✨

可以看到转换效果还不错。

不过这种执行方法耗时较长,每次调用都需要1秒左右的时间。

如果我们需要频繁进行转换,推荐是使用node启动相关的http服务,python直接通过requests获取结果。

在安装目录下新建html2md.js文件,代码如下:

var { 
    Sitdown } = require('sitdown');
var http = require('http');

let sitdown = new Sitdown({ 
   
      keepFilter: ['style'],
      codeBlockStyle: 'fenced',
      bulletListMarker: '-',
      hr: '---',
});

// 创建http server,并传入回调函数:
var server = http.createServer(function (request, response) { 
   
    console.log(request.method + ': ' + request.url);
    let data = '';
    request.on('data', chunk => { 
   
        data += chunk;  // 将接收到的数据暂时保存起来
    });
    request.on('end', () => { 
   
		var markdown = sitdown.HTMLToMD(data);
		response.writeHead(200, { 
   'Content-Type': 'text/html'});
		// 将HTTP响应的HTML内容写入response:
		response.end(markdown);
    });
});

// 让服务器监听18080端口:
server.listen(18080);
console.log('Server is running at http://127.0.0.1:18080/');

执行下面的命令启动nodejs服务:

>node html2md.js
Server is running at http://127.0.0.1:18080/

此时我们在直接http调用:

import requests


def html2md(html, html2md_server="http://127.0.0.1:18080/"):
    res = requests.post(html2md_server, data=html.encode("u8"))
    res.encoding = "u8"
    md = res.text
    return md

html = """<div id="write" class=""><blockquote> <p><span>?博客主页:</span><a href="https://blog.csdn.net/as604049322"><span>https://blog.csdn.net/as604049322</span></a></p> <p><span>?欢迎点赞 ? 收藏 ⭐留言 ? 欢迎讨论!</span></p> <p><span>?本文由 </span><strong><span>小小明-代码实体</span></strong><span> 原创,首发于 </span><strong><span>CSDN</span></strong><span>?</span></p> <p><span>?未来很长,值得我们全力奔赴更美好的生活✨</span></p> </blockquote></div>"""
md = html2md(html)
print(md)

结果与上面一样,但耗时仅15毫秒。

image-20220224161236810

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/196146.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Anchorpoint_the mythology handbook

    Anchorpoint_the mythology handbook之前做一个imageview的transform的动画,从scale(1,1)变成scale(0.3)

    2022年10月8日
    3
  • Pycharm和Pytorch安装教程配置环境以及遇到的问题:

    Pycharm和Pytorch安装教程配置环境以及遇到的问题:Pycharm和Pytorch安装教程配置环境以及遇到的问题:注意:我们每次新建完项目,都要检查一下python解释器和conda.exe是否选择正确。一.如何找到Anconda哪个环境中安装了pytorch?Anconda提供环境,我们安装pytorch也是在一个环境下,所以不是在每个环境中都能用pytorch。那么我们如何找到我们pytorch安装的环境呢?要有NVDIA的显卡,才能用CUDA(AMD的小伙伴可能泪目了),查CUDA的版本比较简单,就不总结了。打开Anconda,输入conda

    2022年8月27日
    3
  • 史上最简单的 IntelliJ IDEA 教程「建议收藏」

    史上最简单的 IntelliJ IDEA 教程「建议收藏」温馨提示:本教程的GitHub地址为「intellij-idea-tutorial」,欢迎感兴趣的童鞋Star、Fork,纠错。1简介  IntelliJIDEA(简称IDEA),是Java语言开发的集成环境,IDEA在业界被公认为最好的Java开发工具之一,尤其在智能代码助手、代码自动提示、重构、J2EE支持、各类版本工具(Git、SVN、GitHub…

    2022年6月8日
    40
  • QQ机器人制作教程,超详细「建议收藏」

    QQ机器人制作教程,超详细「建议收藏」目录前期准备1、机器人框架的下载和配置2、python的配置和安装具体实现1、发送信息2、获取群成员列表3、接收上报的事件4、实现简单的自动回复下一篇文章介绍更多功能前期准备1、机器人框架的下载和配置首先需要一个qq机器人框架,我使用的是基于mirai以及MiraiGo开发的go-cqhttp(里面有开发文档)。框架下载地址Windows下32位文件为go-cqhttp-v*-windows-386.zipWindows下64位文件为go-cqhttp-v*-windows-amd6

    2025年9月19日
    6
  • (怪盗基德的滑翔翼)(最长上升子序列)[通俗易懂]

    (怪盗基德的滑翔翼)(最长上升子序列)[通俗易懂]原题链接怪盗基德是一个充满传奇色彩的怪盗,专门以珠宝为目标的超级盗窃犯。而他最为突出的地方,就是他每次都能逃脱中村警部的重重围堵,而这也很大程度上是多亏了他随身携带的便于操作的滑翔翼。有一天,怪盗基德像往常一样偷走了一颗珍贵的钻石,不料却被柯南小朋友识破了伪装,而他的滑翔翼的动力装置也被柯南踢出的足球破坏了。不得已,怪盗基德只能操作受损的滑翔翼逃脱。假设城市中一共有N幢建筑排成一条线,每幢建筑的高度各不相同。初始时,怪盗基德可以在任何一幢建筑的顶端。他可以选择一个方向逃跑,但是不能中途改变方向

    2022年8月8日
    10
  • 文件无法保存(文件夹已损坏无法读取怎么办)

    要使用EmguCV,首先需要去官网下载安装包(除了下载安装包,还有其他几种方式)。安装完成后,得配置环境变量。这里不再赘述。网上的教程很多。我这里分享一个官网的下载链接:https://sourceforge.net/projects/emgucv/files/emgucv/这里使用窗体程序进行说明,首先新建个窗体1.引用EmguCV的DLL:usingEmgu.CV;usingEmg…

    2022年4月10日
    80

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号