每天学习一点点,成功增加一大步

JavaScrip 去掉文本中所有的HTML标签包括空白

JAVASCRPT zhanghui 413℃

最近在写一个客户的二次开发项目时,遇到判断关键词密度,而关键词密度占比是通过关键词字数*出现次数/所有正文文本数(去标签),在这里就要涉及到到用 JavaScrip 去掉文本中所有的HTML标签包括空白,在网络上寻找多个都不全,现将比较全的记录下来

function removeHTMLTag(str) {
    str = str.replace(/<\/?[^>]*>/g,''); //去除HTML tag
    str = str.replace(/[ | ]*\n/g,'\n'); //去除行尾空白
    str = str.replace(/\n[\s| | ]*\r/g,'\n'); //去除多余空行
    str=str.replace(/ /ig,'');//去掉
    str=str.replace(/(^\s*)|(\s*$)/g, "");
    str=str.replace(/&nbsp;/ig, "");
    return str;
}

 

转载请注明:隨習筆記 » JavaScrip 去掉文本中所有的HTML标签包括空白