<分区>
我正在尝试用 Rust 解析 HTML。似乎可以执行此操作的库是 html5ever
。我找不到任何简单的方法让它接受一个字符串并返回一个可查询的对象。
有没有我可以使用的替代库,它接受一个字符串并返回一个我可以查询的对象?
我想在这里做一些类似网络抓取的事情。
我是一个完全的 Rust 新手。
<分区>
我正在尝试用 Rust 解析 HTML。似乎可以执行此操作的库是 html5ever
。我找不到任何简单的方法让它接受一个字符串并返回一个可查询的对象。
有没有我可以使用的替代库,它接受一个字符串并返回一个我可以查询的对象?
我想在这里做一些类似网络抓取的事情。
我是一个完全的 Rust 新手。
最佳答案
您可以使用 select crate,它基本上是 html5ever 的包装器,但提供了更好的 api。
例如:
use select::document::Document;
use select::predicate::Name;
for i in Document::from_str(html_src_string).find(Name("article")).iter() {
println!("{:?}",i.text() ); //prints text content of all articles
};
select.rs存储库有更详细的示例。
关于html - 是否有 html5ever 的替代库接受一个字符串并返回一个可查询的对象?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35376961/