js删除 HTML 文本中多余的空格、换行和缩进以及不必要的标签

function cleanHtmlText(htmlText) {
  // 删除 HTML 标签中的多余空格、换行和缩进
  var cleanHtml = htmlText.replace(/\s{2,}/g, ' ').replace(/[\r\n]/g, '').replace(/\>(\s+)/g, '>').replace(/(\s+)\</g, '<');
  // 删除不必要的标签
  var tmp = document.createElement('DIV');
  tmp.innerHTML = cleanHtml;
  var whitelist = {
    'a': ['href', 'target'],
    'img': ['src'],
    'del': [],
    'br': []
    // 在这里添加需要保留的标签及其属性
  };
  var nodes = tmp.querySelectorAll('*');
  for (var i = 0, l = nodes.length; i < l; i++) {
    var node = nodes[i], name = node.nodeName.toLowerCase();
    if (whitelist.hasOwnProperty(name)) {
      for (var j = 0, attrs = node.attributes, len = attrs.length; j < len; j++) {
        var attr = attrs[j];
        if (whitelist[name].indexOf(attr.name) === -1) {
          node.removeAttributeNode(attr);
          j--;
          len--;
        }
      }
    } else {
      node.parentNode.removeChild(node);
      i--;
      l--;
    }
  }
  // 返回干净的 HTML 文本
  return tmp.innerHTML;
}

上述函数接受一个 HTML 文本字符串作为参数,返回一个处理后的干净 HTML 文本字符串。函数的操作步骤如下:

  1. 首先使用正则表达式将 HTML 代码中的多余空格、换行和缩进删除,使之保留节点间的必要空格。

    var cleanHtml = htmlText.replace(/\s{2,}/g, ' ').replace(/[\r\n]/g, '').replace(/\>(\s+)/g, '>').replace(/(\s+)\</g, '<');
    
  2. 接着使用 DOM API 将 HTML 字符串转换为 DOM 元素并存储在变量 tmp 中。

    var tmp = document.createElement('DIV');
    tmp.innerHTML = cleanHtml;
    
  3. 再使用一个白名单对象 whitelist,存储需要保留的标签及其属性。

    var whitelist = {
      'a': ['href', 'target'],
      'img': ['src'],
      'del': [],
      'br': []
      // 在这里添加需要保留的标签及其属性
    };
    
  4. 依次遍历 DOM 元素树,对于每一个节点,如果它的标签名不在 whitelist 中,则将其从父节点中删除。如果它的标签名在 whitelist 中,则遍历其所有属性,去除未包含在 whitelist[name] 中的属性。

    var nodes = tmp.querySelectorAll('*');
    for (var i = 0, l = nodes.length; i < l; i++) {
      var node = nodes[i], name = node.nodeName.toLowerCase();
      if (whitelist.hasOwnProperty(name)) {
        for (var j = 0, attrs = node.attributes, len = attrs.length; j < len; j++) {
          var attr = attrs[j];
          if (whitelist[name].indexOf(attr.name) === -1) {
            node.removeAttributeNode(attr);
            j--;
            len--;
          }
        }
      } else {
        node.parentNode.removeChild(node);
        i--;
        l--;
      }
    }
    
  5. 最后将处理后的 HTML 文本字符串输出。

    return tmp.innerHTML;
    

js删除最后字符串中的最后一个字符

获取字符串的长度我们可以使用字符串的 length 属性来获取字符串的长度,就像这样:const str = &quot;hello&quot;;const len = str.length; // len 的值为 5使用 substring 方法删除最后一个字符串有了字符串的长度,我们就可以使用 substring 方法来删除最后一个字符了。具体步骤如下:获取字符串的长度 len;使用 substring 方法从索引 0 开始,取到索引为 len-1 的子串,也就是删除最后一个字符;将删除最后一个字符后的...

日期:2023-04-18 22:30:53 浏览:596

js删除 HTML 文本中多余的空格、换行和缩进以及不必要的标签

function cleanHtmlText(htmlText) { // 删除 HTML 标签中的多余空格、换行和缩进 var cleanHtml = htmlText.replace(/\s{2,}/g, ' ').replace(/[\r\n]/g, '').replace(/\&gt;(\s+)/g, '&gt;').replace(/(\s+)\&lt;/g, '&lt;'); // 删除不必要的标签 var tmp = document.createElement('DIV'); tm...

日期:2023-04-18 22:36:08 浏览:605

js让标题闪动进行消息提示

首先,我们需要把修改网页标题和让它闪动这两个功能独立出来。在函数内部,我们定义了三个变量:pageTitle是当前网页的原始标题,isPageActive表示当前页面是否处于活跃状态(即用户正在当前页面),flashInterval则是用于控制标题闪动的定时器。在函数内部,我们定义了一个flash函数,它根据isPageActive变量的值,交替显示原始标题和要闪动的标题。然后,我们监听了页面的聚焦和失焦事件。如果页面失焦(即用户把当前页面切换到了其他页面或其他应用程序),则设置isPageActive为t...

日期:2023-04-18 22:39:34 浏览:634

js将图片转换成ico的方法

首先要在HTML中放置一个按钮和一个用于展示图片的标签,如下所示:&lt;input type=&quot;file&quot; id=&quot;fileInput&quot;&gt;&lt;img id=&quot;preview&quot;&gt;&lt;button type=&quot;button&quot; onclick=&quot;convertToIco()&quot;&gt;转换成ICO&lt;/button&gt;其中,input标签用于选择图片文件,img标签用于预览图片,butt...

日期:2023-04-18 22:43:25 浏览:564

js获取当前日期的函数

function getCurrentDate() { // 创建一个Date对象,自动获取当前日期和时间 const currentDate = new Date(); // 分别获取年、月、日信息 const year = currentDate.getFullYear(); const month = currentDate.getMonth() + 1; // 月份从0开始,所以要加1 const date = currentDate.getDate(); // 拼接成指定格式(这...

日期:2023-04-19 15:05:35 浏览:704

js在控制台中获取console.log()打印的内容

可以使用以下代码在控制台中获取console.log()打印的内容:// 通过重定向console.log()来获取打印的内容let consoleLog = console.log;console.log = function () { // 将参数转换成数组 let args = Array.prototype.slice.call(arguments); // 将日志记录到数组中 console.log.history = console.log.history || []; console...

日期:2023-04-24 16:42:37 浏览:875

js完整实现图片选择和预览的功能

创建HTML页面,包含一个按钮和一个空的div用来展示所选图片:&lt;!DOCTYPE html&gt;&lt;html&gt;&lt;head&gt; &lt;title&gt;选择图片并预览&lt;/title&gt;&lt;/head&gt;&lt;body&gt; &lt;input type=&quot;file&quot; id=&quot;fileInput&quot;&gt; &lt;div id=&quot;preview&quot;&gt;&lt;/div&gt; &lt;script...

日期:2023-04-24 16:45:13 浏览:741

js通过设置document.title使网页标题闪烁闪动进行提示

function changeTitle(title) { // 首先将网页标题改为参数中传入的标题 document.title = title; // 定义一个计数器,用来记录闪动次数 let count = 0; // 定义一个定时器,每500毫秒执行一次 // 该定时器的作用是让标题在原始状态和闪烁状态之间切换 const timerId = setInterval(() =&gt; { // 如果计数器为偶数,则将标题设置回原来的值 if (count % 2 === 0...

日期:2023-04-24 16:47:09 浏览:555

js使用正则表达式删除 HTML 多余空行的方法

下面是一种使用正则表达式删除 HTML 多余空行的方法,可以将其封装为函数,接收参数为包含 HTML 代码的文本。以下是代码示例:function removeHtmlEmptyLines(html) { // 使用正则表达式替换多余的换行符 const cleanedHtml = html.replace(/[\r\n]+/g, '\n'); // 将替换后的 HTML 代码作为 DOM 元素插入到一个临时的 div 中 const tempDiv = document.createElement...

日期:2023-04-24 16:51:36 浏览:778

一个简单的实现异步加载远程js文件的函数

function loadScript(url, callback) { // 创建script标签 var script = document.createElement('script'); // 设置src属性 script.src = url; // 设置async属性为true,表示异步加载 script.async = true; // 添加onload事件处理函数 script.onload = function() { // 如果有回调函数,则执行回调 if (t...

日期:2023-04-25 09:15:12 浏览:724