/s]+))/s*[^>]*>";2,得到网页的标题:            string" />
牛骨文教育服务平台(让学习变的简单)
博文笔记

正则表达式,在html标签上的应用

创建时间:2010-08-18 投稿人: 浏览次数:1595

1,得到网页上的链接地址:
      string matchString = @"<a[^>]+href=/s*(?:"(?<href>[^"]+)"|""(?<href>[^""]+)""|(?<href>[^>/s]+))/s*[^>]*>";
2,得到网页的标题:
           string matchString = @"<title>(?<title>.*)</title>";
3,去掉网页中的所有的html标记:
           string temp = Regex.Replace(html, "<[^>]*>", "");        //html是一个要去除html标记的文档
        java 中去掉网页中的所有标签
           str = str.replaceAll("<[^>]*>", "");
4, string matchString = @"<title>([/S/s/t]*?)</title>";

5,js去掉所有html标记的函数:
           function delHtmlTag(str)
          {
             return str.replace(/<//?.+?>/g,"");//去掉所有的html标记
          }
        这个可能IE5会错,那用这个,梅花的:
         function delHtmlTag(str)
{
        return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
}

声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。