asp.net过滤HTML标签，只保留换行与空格

自己从网上找了一个过滤HTML标签的方法，我也不知道谁的才是原创的，反正很多都一样。我把那方法复制下来，代码如下：

///   <summary>

///   去除HTML标记

///   </summary>

///   <param   name="NoHTML">包括HTML的源码   </param>

///   <returns>已经去除后的文字</returns>

public static string NoHTML(string Htmlstring)

{

  //删除脚本

  Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "",

    RegexOptions.IgnoreCase);

  //删除HTML

  Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", "   ",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9",

    RegexOptions.IgnoreCase);

  Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "",

    RegexOptions.IgnoreCase);

  Htmlstring.Replace("<", "");

  Htmlstring.Replace(">", "");

  Htmlstring.Replace("\r\n", "");

  Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();

  return Htmlstring;

}

以上代码是从网上直接复制过来的，这个确实能过滤掉所有的HTML标签，但是这个不是我想要的，这个过滤得太干净了，我如果用textarea输入框的话，我是要保留空格跟换行的。

然后我就自己改了一下这个方法，textarea的换行是\n，所以我得把这些标签重新匹配替换成<br>，这样的话从数据库中读取到页面时，就能正确的换行了，把空格替换成HTML的空格符，大功告成。

       ///   <summary>

        ///   去除HTML标记(保留br跟\r\n)（此方法由博客园-三卷天书修改成）

        ///   </summary>

        ///   <param   name="NoHTML">包括HTML的源码   </param>

        ///   <returns>已经去除后的文字</returns>

        public static string NewNoHTML(string Htmlstring)

        {

            //Htmlstring.Replace("\\r\\n", "%r%n").Replace("<br>","%br%").Replace("<br/>","%br&%").Replace("\\n","%n");

            //删除脚本

            Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "",

              RegexOptions.IgnoreCase);

            //删除HTML

            Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "",

              RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"",

              RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&",

              RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<",

              RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">",

              RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", "   ",

              RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1",

              RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2",

              RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3",

              RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9",

              RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "",

              RegexOptions.IgnoreCase);

            Htmlstring.Replace("<", "");

            Htmlstring.Replace(">", "");

            //Htmlstring.Replace("\r\n", "");

            Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring);

            Htmlstring = Regex.Replace(Htmlstring, @"((\r\n))", "<br>");

            Htmlstring = Regex.Replace(Htmlstring, @"(\r|\n)", "<br>");

            Htmlstring = Regex.Replace(Htmlstring, @"(\s)", "&nbsp;");

            return Htmlstring;

        }

这个过滤可以用于让用户输入发布内容时的过滤，如有不足之处，请大家批评指正！

asp.net过滤HTML标签，只保留换行与空格的更多相关文章

ASP.NET过滤HTML标签只保留换行与空格的方法
这篇文章主要介绍了ASP.NET过滤HTML标签只保留换行与空格的方法,包含网上常见的方法以及对此方法的改进,具有一定的参考借鉴价值,需要的朋友可以参考下本文实例讲述了ASP.NET过滤HTML ...
android TextView加载html 过滤所有标签，保留换行标签
情景: TextView加载后端接口获取到的html富文本遇到的问题: 客户端通过接口取到的数据如下: <p style="margin-top: 0px; margin-botto ...
运用正则表达式在Asp中过滤Html标签代码的四种不同方法
Function RemoveHTML(strHTML)Dim objregExp, Match, MatchesSet objRegExp = New RegexpobjRegExp.IgnoreC ...
C#正则过滤HTML标签并保留指定标签的方法
本文实例讲述了C#正则过滤html标签并保留指定标签的方法.分享给大家供大家参考,具体如下: 这边主要看到一个过滤的功能: public static string FilterHtmlTag(str ...
asp.net过滤HTML标签的几个函数
以下是引用片段: ----- /**/ /// <summary> /// 去除HTML标记 /// </summary> /// <param name="N ...
textarea保留换行和空格
<style> pre {white-space: pre-wrap;} </style> //替换textare <pre class="feedback_q ...
angularjs中类似textarea的换行、空格处理
背景今天测试人员测试出来一个显示数据的页面,没有换行. 原因剖析这个页面是从一个<textarea>的页面拿到的数据,存到数据库中后再返回来的. 1. 知道这点之后,就有了调查方向了: ...
php正则过滤html标签、空格、换行符的代码，提取图片
$descclear = str_replace("r","",$descclear);//过滤换行 $descclear = str_replace(&quo ...
利用正则表达式去除所有html标签，只保留文字
后台将富文本编辑器中的内容返回到前端时如果带上了标签,这时就可以利用这种方法只保留文字. 标签的格式有以下几种 1.<div class="test"></div ...

随机推荐

iOS下的WiFi开发
iOS下Wi-Fi开发需要添加依赖库SystemConfiguration.framework,在需要使用Wi-Fi信息的控制器下引入头文件#import <SystemConfiguratio ...
Linux 修改DNS解决 Could not retrieve mirrorlist" 报错
CentOS yum有时出现“Could not retrieve mirrorlist ”的解决办法——resolv.conf的配置或者IP配置文件上写入缺少DNS引起的问题1. 无法识别域名 ...
2.mysql高级查询
01.SQL高级查询_排序 1.排序语句:order by 排序字段名 asc(默认的-升序) / desc(降序); 2.例如:查询所有服装类商品,将查询结果以价格升序排序: ...
review34
Thread类与线程的创建让线程启动时使用我们自己创建run()的两种方式:一种是继承Thread类,实现其中的run()方法,然后用继承的类用无参构造方法创建对象就可以了.第二种是实现Runnab ...
js轮训
Later.js,一个独立的JavaScript类库,提供了循环事件触发的高级应用,可以为项目替换以上两种方法. 通常,我们要完成复杂的时间预定,需要大量的if...else语句.Later.js提供 ...
Linux脚本基础
1.文本编辑命令模式快捷键命令命令作用 dd 删除(剪切)光标所在整行. 5dd 删除(剪切)从光标处开始的5行. yy 复制光标所在整行. 5yy 复制从光标处开始的5行. n 显示搜索命令定 ...
hzau 1208 Color Circle（dfs）
1208: Color Circle Time Limit: 1 Sec Memory Limit: 1280 MBSubmit: 289 Solved: 85[Submit][Status][W ...
Vue中mixin的用法
在项目中我们经常会遇到多个组件调用同一个方法的问题,为了避免每次都在.vue文件中定义并调用,我们可采用vue的mixin的用法: 具体使用如下: 我们需要在main.js中引入mixins文件夹下的 ...
mac下用brew安装mongodb
分享到:QQ空间新浪微博腾讯微博人人网微信 mac 下安装mongoDB一般俩种方法. (1)下载源码,解压,编译,配置,启动比较艰难的一种模式. (2)brew install mongodb , ...
马拉车——模版+KMP——模版
void Manacher(){ ;t[i];++i,len+=){ s[i<<]='#'; |]=t[i]-'A'+'a'; |]=t[i]; } s[len++]='#'; ,pos= ...

asp.net过滤HTML标签，只保留换行与空格

asp.net过滤HTML标签，只保留换行与空格的更多相关文章

随机推荐

热门专题