HTML Parser是一个Java库用于解析时尚的HTML线性或者嵌套。其主要用于改造或提取,它具有过滤,游客,自定义标记和易于使用的JavaBeans。 It is a fast, robust and well tested package.它是一种快速,稳健,是行之有效的方案。 Welcome to the homepage of HTMLParser - a super-fast real-time parser for real-world HTML.欢迎您到HTMLParser网
HTML解析实用库,非常好用 public class HtmlLinkParser { //获取子链接,url为网页url,filter是链接过滤器,返回该页面子链接的HashSet public static Set extracLinks(String url, LinkFilter filter) { Set links = new HashSet(); try { Parser parser = new Parser(url); parser.setEncoding("utf-8")