牛骨文教育服务平台(让学习变的简单)
博文笔记

正则表达式 提取 html 标签的内容

创建时间:2014-05-12 投稿人: 浏览次数:1016


例如:
<h1>内容<h1>

正则表达式:

/<.+?>(.+?)<.+?>/


Java实现:

        

        String htmlStr = "<h1>XXX<h1/><h2>YYY<h2/>";

        Pattern pattern = Pattern.compile("<.+?>(.+?)<.+?>");
        Matcher matcher = pattern.matcher(htmlStr);
        // 获得结果集
        while (matcher.find()) {
            System.out.println(matcher.group(1));
        }


声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。