Javascript | 3种 HTML 转换为纯文本的方法

yumo6668个月前 (04-27)技术文章70

前几天,我手里的一个项目需要将富文本的所有 html 标签全部删除,得到纯文本后再存储到数据库中。在一系列得搜索操作之后,我找到了实现这个目的的几种方法,在这里我分享给大家,当你遇到同样的情况兴许也能用的上。

1. 使用 .replace(/<[^>]*>/g, '')

这个方法是从文本中去除 html 标签最简单的方法。它使用字符串的方法 .replace(待替换的字符串,替换后的字符串) 将 HTML 标签替换成空值。 /g 是表示替换字符串所有匹配的值,即字符串中所有符合条件的字符都将被替换。

这个方法的缺点是有些 HTML 标签不能被剔除,不过它依然很好用。

2. 创建临时DOM元素并获取其中的文本

这种方法是完成该问题的最有效的方法。创建一个临时 DOM 并给他赋值,然后我们使用 DOM 对象方法提取文本。

3. 使用 html-to-text npm 包

html-to-text 这个包的功能很全了,转换也有许多的选项比如:wordwrap, tags, whitespaceCharacters , formatters 等等。

安装:

npm install html-to-text

使用:

最后感谢阅读,如果此文对您有帮助,请点赞或添加关注。

相关文章

是什么组成了html?html组成元素有哪些?

网页html的组成是由:文字、图片、音频、视频、超链接组成。1-文字由什么组成?文字标签在“body”标签下,由文本标签比如:标题<h1>~<h6>,段落<p>&l...

什么是 HTML

什么是 HTML?HTML 是用来描述网页的一种语言。HTML 指的是超文本标记语言 (Hyper Text Markup Language)HTML 不是一种编程语言,而是一种标记语言 (marku...

HTML元素基础讲解

HTML元素的基本结构HTML元素通常由开始标签、内容和结束标签组成。基本结构如下:<标签名>内容</标签名>例如,一个段落元素:<p>这是一个段落。</p&...

前端入门——什么是HTML,如何快速学习

上一篇介绍了网页的基本结构,那如何编写网页的内容? 前提是要学会HTML标签的用法,本篇主要介绍HTML标签是什么,如何学习,需要大概多长时间学习。本篇主要基于html5介绍,html5 是最新版的标...

用HTML制作个人网站? 分享我的相关经验和HTML基础知识

我对网站制作有着浓厚的兴趣,清楚HTML在个人网站建设中的核心作用。这就像盖房子的地基,对展示网页内容至关重要。现在,我想分享我的经验,和大家谈谈如何用HTML制作个人网站。HTML基础概念超文本标记...

零基础入门前端之:html是什么

云端源想云端源想it培训,帮你轻松拿offer”嗨~大家好,我是学长今天的你过得还好吗?- 2023.03.03 -一、HTML是什么?HTML ,全称“Hyper Text Markup Langu...