如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
/** * 得到网页中图片的地址 * @param sets html字符串 */ public Set< String > getImgStr(String htmlStr) { Set< String > pics = new HashSet< String >(); String img = ""; Pattern p_image; Matcher m_image; String regEx_img = "< img. *src\\s*=\\s*(.*?)[^>]*?>"; p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE); m_image = p_image.matcher(htmlStr); while (m_image.find()) { // 得到< img />数据 img = m_image.group(); // 匹配< img >中的src数据 Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img); while (m.find()) { pics.add(m.group(1)); } } return pics; } |
以上这篇Java 获取Html文本中的img标签下src中的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/xyajia/article/details/77648413