Jsoup是一个Java库,用于解析HTML文档,它提供了一种非常方便的方式来提取和操作数据,使用类似于jQuery的CSS选择器语法,以下是一个简单的示例,展示了如何使用Jsoup来解析HTML并提取特定元素的内容:
(图片来源网络,侵删)import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; public class JsoupExample { public static void main(String[] args) { // 示例HTML字符串 String html = "<html><head><title>示例网页</title></head>" + "<body><p>这是一个段落。</p><p>这是另一个段落。</p></body></html>"; // 解析HTML字符串 Document document = Jsoup.parse(html); // 提取标题 String title = document.title(); System.out.println(" " + title); // 提取第一个段落 Element firstParagraph = document.select("p").first(); System.out.println("第一个段落: " + firstParagraph.text()); // 提取所有段落 for (Element paragraph : document.select("p")) { System.out.println("段落: " + paragraph.text()); } } }
在这个示例中,我们首先导入了所需的Jsoup类,我们创建了一个包含HTML内容的字符串,并使用Jsoup.parse()
方法将其解析为一个Document
对象,我们使用title()
方法提取标题,并使用select()
方法和CSS选择器提取特定的元素,我们遍历所有匹配的元素并打印它们的文本内容。
最新评论
本站CDN与莫名CDN同款、亚太CDN、速度还不错,值得推荐。
感谢推荐我们公司产品、有什么活动会第一时间公布!
我在用这类站群服务器、还可以. 用很多年了。