有没有解析器/库能够使用
Java将HTML文档读入DOM树?我想使用Java提供的标准DOM / Xpath API.
大多数库似乎有自定义的API来解决这个任务.此外,转换为XML-DOM的HTML似乎不受大多数可用解析器的支持.
任何想法或经验与一个好的HTML DOM解析器?
解决方法
JTidy,通过将流处理为XHTML,然后使用您最喜欢的DOM实现来重新解析,或者使用parseDOM,如果有限的DOM imp给出足够的.
或者Neko.
有没有解析器/库能够使用 Java将HTML文档读入DOM树?我想使用Java提供的标准DOM / Xpath API. 大多数库似乎有自定义的API来解决这个任务.此外,转换为XML-DOM的HTML似乎不受大多数可用解析器的支持. 任何想法或经验与一个好的HTML DOM解析器? JTidy,通过将流
有没有解析器/库能够使用
Java将HTML文档读入DOM树?我想使用Java提供的标准DOM / Xpath API.
大多数库似乎有自定义的API来解决这个任务.此外,转换为XML-DOM的HTML似乎不受大多数可用解析器的支持.
任何想法或经验与一个好的HTML DOM解析器?
JTidy,通过将流处理为XHTML,然后使用您最喜欢的DOM实现来重新解析,或者使用parseDOM,如果有限的DOM imp给出足够的.
或者Neko.