加入收藏 | 设为首页 | 会员中心 | 我要投稿 莱芜站长网 (https://www.0634zz.com/)- 云连接、建站、智能边缘云、设备管理、大数据!
当前位置: 首页 > 编程开发 > Java > 正文

使用Java将HTML文件读入DOM树

发布时间:2020-08-04 20:50:47 所属栏目:Java 来源:互联网
导读:有没有解析器/库能够使用 Java将HTML文档读入DOM树?我想使用Java提供的标准DOM / Xpath API. 大多数库似乎有自定义的API来解决这个任务.此外,转换为XML-DOM的HTML似乎不受大多数可用解析器的支持. 任何想法或经验与一个好的HTML DOM解析器? JTidy,通过将流

有没有解析器/库能够使用 Java将HTML文档读入DOM树?我想使用Java提供的标准DOM / Xpath API.

大多数库似乎有自定义的API来解决这个任务.此外,转换为XML-DOM的HTML似乎不受大多数可用解析器的支持.

任何想法或经验与一个好的HTML DOM解析器?

解决方法

JTidy,通过将流处理为XHTML,然后使用您最喜欢的DOM实现来重新解析,或者使用parseDOM,如果有限的DOM imp给出足够的.

或者Neko.

(编辑:莱芜站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读