HTML到Markdown转换器和爬虫Clipper

47次阅读
没有评论

共计 512 个字符,预计需要花费 2 分钟才能阅读完成。

Clipper 是一个开源的 HTML 到 Markdown 转换器和爬虫工具,允许你轻松地从网页中剪辑内容并将其转换为 Markdown 格式。它在内部使用 Mozilla 的 Readability 库和 Turndown 库来解析网页内容并将其转换为 Markdown 格式。Clipper 还提供了一个爬虫功能,用于爬取网站并剪辑所有页面。Clipper 提供了一种快速简便的方式,用于保存网络上的内容片段,以供个人存档或笔记记录之用,类似于 Evernote Web Clipper 或 Notion Web Clipper 等浏览器扩展。然而,Clipper 完全在终端中运行,因此您无需安装任何扩展程序或注册账号。

GitHub 地址:https://github.com/philschmid/clipper.js

HTML 到 Markdown 转换器和爬虫 Clipper

主要特点:

  •  轻松剪辑 Web 内容并将其转换为 Markdown。
  •  支持 URL 和文件输入。
  •  用于全面网站内容收集的爬网功能。
  • 可选输出格式:Markdown 或 JSON,包括 Markdown 和元数据。
  • 无需浏览器扩展:功能类似 Evernote Web Clipper 或 Notion Web Clipper 相,但 Clipper 完全在终端运行,不需要安装任何扩展或注册账户。
正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2024-01-11发表,共计512字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。
评论(没有评论)
验证码