最近在写一个客户的二次开发项目时,遇到判断关键词密度,而关键词密度占比是通过关键词字数*出现次数/所有正文文本数(去标签),在这里就要涉及到到用 JavaScrip 去掉文本中所有的HTML标签包括空白,在网络上寻找多个都不全,现将比较全的记录下来
function removeHTMLTag(str) { str = str.replace(/<\/?[^>]*>/g,''); //去除HTML tag str = str.replace(/[ | ]*\n/g,'\n'); //去除行尾空白 str = str.replace(/\n[\s| | ]*\r/g,'\n'); //去除多余空行 str=str.replace(/ /ig,'');//去掉 str=str.replace(/(^\s*)|(\s*$)/g, ""); str=str.replace(/ /ig, ""); return str; }
转载请注明:隨習筆記 » JavaScrip 去掉文本中所有的HTML标签包括空白