content是根据网址获得的网页源码字符串 - (NSString *)changeToString:(NSString *)content { NSRegularExpression *regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"<[^>]*>|\n" options:0 error:nil]; content = [regularExpretion stringByRe…
原文 C#用正则表达式去掉Html中的script脚本和html标签 /// <summary>         /// 用正则表达式去掉Html中的script脚本和html标签         /// </summary>         /// <param name="Htmlstring"></param>         /// <returns></returns>         public st…
        /// 去掉字符串中的数字           public static string RemoveNumber(string key)           {               return Regex.Replace(key, @"\d", "");           }   //去掉字符串中的非数字 public static string RemoveNotNumber(string key)   {       return …
/// <summary>/// 去掉字符串中的数字/// </summary>/// <param name="key"></param>/// <returns></returns>public static string RemoveNumber(string key){    return System.Text.RegularExpressions.Regex.Replace(key, @"\d…
/// <summary>/// 去掉字符串中的数字/// </summary>/// <param name="key"></param>/// <returns></returns>public static string RemoveNumber(string key){    return System.Text.RegularExpressions.Regex.Replace(key, @"\d…
text = Regex.Replace(text, @"(?i)(?<=<img\b[^>]*?src=\s*(['""]?))([^'""]*/)+(?=[^'""/]+\1)", "/Images/"); //text 为HTML代码段 //////////////////////////////////////////////////////////////////////////…
有时候会获得一些带html标签的字符串,需要把html标签去掉,获得干净的字符串,这时候可以使用正则表达式. 代码如下: import re htmeString = '''<ul id="TopNav"><li><a href="/EditPosts.aspx" id="TabPosts">随笔</a></li> <li><a href="/EditArti…
public static List<String> getImageSrc(String htmlCode) { List<String> imageSrcList = new ArrayList<String>(); Pattern p = Pattern.compile("<img\\b[^>]*\\bsrc\\b\\s*=\\s*('|\")?([^'\"\n\r\f>]+(\\.jpg|\\.bmp|\\.eps…
/// <summary> /// 过滤html标签 /// </summary> /// <param name="Htmlstring"></param> /// <returns></returns> public string ParseTags(string Htmlstring) { //删除脚本 Htmlstring = Regex.Replace(Htmlstring, @"<scr…