正则表达式 提取 html 标签的内容
例如:
<h1>内容<h1>
正则表达式:
/<.+?>(.+?)<.+?>/
Java实现:
String htmlStr = "<h1>XXX<h1/><h2>YYY<h2/>"; Pattern pattern = Pattern.compile("<.+?>(.+?)<.+?>"); Matcher matcher = pattern.matcher(htmlStr); // 获得结果集 while (matcher.find()) { System.out.println(matcher.group(1)); }
声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。
- 上一篇: java根据 正则表达式解析html网页内容
- 下一篇: 匹配获取HTML标签属性的正则 表达式