Javascript | 3种 HTML 转换为纯文本的方法

yumo66610个月前 (04-27)技术文章89

前几天,我手里的一个项目需要将富文本的所有 html 标签全部删除,得到纯文本后再存储到数据库中。在一系列得搜索操作之后,我找到了实现这个目的的几种方法,在这里我分享给大家,当你遇到同样的情况兴许也能用的上。

1. 使用 .replace(/<[^>]*>/g, '')

这个方法是从文本中去除 html 标签最简单的方法。它使用字符串的方法 .replace(待替换的字符串,替换后的字符串) 将 HTML 标签替换成空值。 /g 是表示替换字符串所有匹配的值,即字符串中所有符合条件的字符都将被替换。

这个方法的缺点是有些 HTML 标签不能被剔除,不过它依然很好用。

2. 创建临时DOM元素并获取其中的文本

这种方法是完成该问题的最有效的方法。创建一个临时 DOM 并给他赋值,然后我们使用 DOM 对象方法提取文本。

3. 使用 html-to-text npm 包

html-to-text 这个包的功能很全了,转换也有许多的选项比如:wordwrap, tags, whitespaceCharacters , formatters 等等。

安装:

npm install html-to-text

使用:

最后感谢阅读,如果此文对您有帮助,请点赞或添加关注。

相关文章

用HTML制作个人网站? 分享我的相关经验和HTML基础知识

我对网站制作有着浓厚的兴趣,清楚HTML在个人网站建设中的核心作用。这就像盖房子的地基,对展示网页内容至关重要。现在,我想分享我的经验,和大家谈谈如何用HTML制作个人网站。HTML基础概念超文本标记...

「HTML」从零开始学网页制作

网页是一个包含HTML标签的纯文本文件网页制作离不开浏览器和制作网页工具浏览器推荐【谷歌浏览器】或【火狐浏览器】制作网页工具用电脑自带的【记事本】即可六步即可学会最基础的网页制作!第一步右击桌面,选择...

前端入门——html 表单控件使用

上篇介绍了表单的使用,表单有很多控件,比如输入框,密码框、文本域,按钮等。按类型可分如下:输入类控件菜单类控件输入类组件 —— input此类控件有很多种类型,使用<input type=...

这里有一份HTML的超全教程,自学建网站不再是梦

在互联网高速发展的今天,我们通过浏览器可以看到各种各样的网站,包含了各式不同的领域还有内容,通过点击网站上的标签和栏目我们就能够很方便地看到网站上显示的各种数据,而这些都是建立在HTML这种标记语言的...

Python爬虫:用Beautifulsoup爬取html文本数据

Beautifulsoup介绍:是一个高效的网页解析库,可以从HTML或XML文件中提取数据支持不同的解析器,比如,对HTML解析,对XML解析,对HTML5解析就是一个非常强大的工具,爬虫利器一个灵...