java在网页上面抓取邮件地址的方法

2019-12-06 13:58shichen2014 JAVA教程

这篇文章主要介绍了java在网页上面抓取邮件地址的方法,是比较典型的Java正则匹配应用实例,具有一定的参考借鉴价值,需要的朋友可以参考下

本文实例讲述了java在网页上面抓取邮件地址的方法。分享给大家供大家参考。具体实现方法如下：

	import java.io.BufferedReader;  

	import java.io.InputStreamReader;  

	import java.net.URL;  

	import java.util.regex.Matcher;  

	import java.util.regex.Pattern;  

	public class h1  

	{  

	   public static String   getWebCon(String domain)  

	   {  

	    System.out.println("开始抓取邮件地址..("+domain+")");  

	    StringBuffer sb=new StringBuffer();  

	    try  

	    {  

	     java.net.URL url=new java.net.URL(domain);  

	     BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream()));  

	     String line;  

	     while((line=in.readLine())!=null)  

	     {  

	      parse(line);  

	     }  

	     in.close();  

	    }  

	    catch(Exception e)  

	    {  

	     sb.append(e.toString());  

	     System.err.println(e);  

	    }  

	    return sb.toString();  

	   }  

	   public static void main(String[] args)  

	   {  

	    String s;  

	    s=h1.getWebCon("http://post.baidu.com/f?kz=34942387"); //这是要抓取的网页,自己可以试下.  

	    //System.out.println(s);  

	   }  

	   private static void parse(String line)  

	   {  

	    Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");//邮箱的正则表达式  

	    Matcher m=p.matcher(line);  

	    while(m.find())  

	    {  

	     System.out.println(m.group());  

	    }  

	   }  

	}