用一个例子来说明,比如这个http://video.sina.com.cn/v/b/75314002-1648211320.html。
用火狐打开,开启firebug,得到如下信息。
其中在这个请求
http://v.iask.com/v_play.php?vid=75314002&uid=1648211320&pid=478&tid=&plid=4001&prid=ja_7_3485822616&referrer=&ran=0.2936802236363292&r=video.sina.com.cn
中得到的响应有我们想要的xml信息,其中vid就是上面红色部分,uid后面的都可以忽略,我们在浏览器中直接输入http://v.iask.com/v_play.php?vid=75314002还是可以得到相同的信息。自此解析的思路就变清晰了,在视频链接中提取出vid,使用http://v.iask.com/v_play.php?vid=得到xml文件,解析xml文件就可以得到真实视频地址了。
下面的是解析xml的代码,使用sax解析xml。首先定义xml reader。
package hdu.fang.parser;
import hdu.fang.model.Video;
import java.util.ArrayList;
import java.util.List;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
public class XMLSaxReader extends DefaultHandler {
private List<Video> videos = null;
private Video video = null;
private Long timeLength = null;
private String tag = null;
@Override
public void startDocument() throws SAXException {
videos = new ArrayList<Video>();
}
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
if ("durl".equals(qName)) {
video = new Video();
}
tag = qName;
}
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
if ("durl".equals(qName)) {
videos.add(video);
video = null;
}
tag = null;
}
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
if (tag != null) {
String data = new String(ch, start, length);
if ("timelength".equals(tag)) {
timeLength = Long.valueOf(data);
} else if ("order".equals(tag)) {
video.setOrder(Integer.valueOf(data));
} else if ("url".equals(tag)) {
video.setUrl(data);
} else if ("length".equals(tag)) {
video.setLength(Integer.valueOf(data));
}
}
}
public List<Video> getVideos() {
return videos;
}
public long getLength() {
return timeLength;
}
}
Video类是我自己定义的一个数据model。在主函数里我们只要调用sax工厂实例化解析器就行了。
SAXParserFactory sf = SAXParserFactory.newInstance();
SAXParser sp = sf.newSAXParser();
XMLSaxReader reader = new XMLSaxReader();
InputStream in_withcode = new ByteArrayInputStream(
xml.getBytes("UTF-8"));//xml就是刚得到的xml文件,类型String
sp.parse(in_withcode, reader);
videos=reader.getVideos();//得到Video List
timeLength=reader.getLength();//得到视频长度
System.out.println(videos);
在xml文件里还有很多其他信息,都可以解析出来,看自己需要了。