rust - 返回迭代器(或任何其他特征)的正确方法是什么?

标签 rust

以下 Rust 代码编译和运行没有任何问题。

fn main() {
    let text = "abc";
    println!("{}", text.split(' ').take(2).count());
}

在那之后,我尝试了类似的东西......但它没有编译

fn main() {
    let text = "word1 word2 word3";
    println!("{}", to_words(text).take(2).count());
}

fn to_words(text: &str) -> &Iterator<Item = &str> {
    &(text.split(' '))
}

主要问题是我不确定函数 to_words() 应该有什么返回类型。编译器说:

error[E0599]: no method named `count` found for type `std::iter::Take<std::iter::Iterator<Item=&str>>` in the current scope
 --> src/main.rs:3:43
  |
3 |     println!("{}", to_words(text).take(2).count());
  |                                           ^^^^^
  |
  = note: the method `count` exists but the following trait bounds were not satisfied:
          `std::iter::Iterator<Item=&str> : std::marker::Sized`
          `std::iter::Take<std::iter::Iterator<Item=&str>> : std::iter::Iterator`

执行此操作的正确代码是什么? ....我的知识差距在哪里?

最佳答案

我发现让编译器指导我很有用:

fn to_words(text: &str) { // Note no return type
    text.split(' ')
}

编译给出:

error[E0308]: mismatched types
 --> src/lib.rs:5:5
  |
5 |     text.split(' ')
  |     ^^^^^^^^^^^^^^^ expected (), found struct `std::str::Split`
  |
  = note: expected type `()`
             found type `std::str::Split<'_, char>`
help: try adding a semicolon
  |
5 |     text.split(' ');
  |                    ^
help: try adding a return type
  |
3 | fn to_words(text: &str) -> std::str::Split<'_, char> {
  |                         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^

按照编译器的建议并将其复制粘贴为我的返回类型(稍作清理):

use std::str;

fn to_words(text: &str) -> str::Split<'_, char> {
    text.split(' ')
}

问题是你不能返回像 Iterator 这样的特征因为特征没有大小。这意味着 Rust 不知道要为类型分配多少空间。你cannot return a reference to a local variable, either , 所以返回 &dyn Iterator是一个非首发。

实现特征

从 Rust 1.26 开始,您可以使用 impl trait :

fn to_words<'a>(text: &'a str) -> impl Iterator<Item = &'a str> {
    text.split(' ')
}

fn main() {
    let text = "word1 word2 word3";
    println!("{}", to_words(text).take(2).count());
}

如何使用它是有限制的。您只能返回一个类型(没有条件!),并且它必须用于自由函数或固有实现。

盒装

如果你不介意损失一点效率,你可以返回一个Box<dyn Iterator> :

fn to_words<'a>(text: &'a str) -> Box<dyn Iterator<Item = &'a str> + 'a> {
    Box::new(text.split(' '))
}

fn main() {
    let text = "word1 word2 word3";
    println!("{}", to_words(text).take(2).count());
}

这是允许动态调度 的主要选项。也就是说,代码的确切实现是在运行时而不是编译时决定的。这意味着这适用于需要根据条件返回多个具体类型的迭代器的情况。

新类型

use std::str;

struct Wrapper<'a>(str::Split<'a, char>);

impl<'a> Iterator for Wrapper<'a> {
    type Item = &'a str;

    fn next(&mut self) -> Option<&'a str> {
        self.0.next()
    }

    fn size_hint(&self) -> (usize, Option<usize>) {
        self.0.size_hint()
    }
}

fn to_words(text: &str) -> Wrapper<'_> {
    Wrapper(text.split(' '))
}

fn main() {
    let text = "word1 word2 word3";
    println!("{}", to_words(text).take(2).count());
}

类型别名

作为pointed out by reem

use std::str;

type MyIter<'a> = str::Split<'a, char>;

fn to_words(text: &str) -> MyIter<'_> {
    text.split(' ')
}

fn main() {
    let text = "word1 word2 word3";
    println!("{}", to_words(text).take(2).count());
}

处理闭包

impl Trait不可用,闭包使事情变得更复杂。闭包创建匿名类型,这些类型不能在返回类型中命名:

fn odd_numbers() -> () {
    (0..100).filter(|&v| v % 2 != 0)
}
found type `std::iter::Filter<std::ops::Range<{integer}>, [closure@src/lib.rs:4:21: 4:36]>`

在某些情况下,这些闭包可以用函数代替,函数可以命名为:

fn odd_numbers() -> () {
    fn f(&v: &i32) -> bool {
        v % 2 != 0
    }
    (0..100).filter(f as fn(v: &i32) -> bool)
}
found type `std::iter::Filter<std::ops::Range<i32>, for<'r> fn(&'r i32) -> bool>`

并遵循上述建议:

use std::{iter::Filter, ops::Range};

type Odds = Filter<Range<i32>, fn(&i32) -> bool>;

fn odd_numbers() -> Odds {
    fn f(&v: &i32) -> bool {
        v % 2 != 0
    }
    (0..100).filter(f as fn(v: &i32) -> bool)
}

处理条件

如果需要有条件地选择迭代器,引用Conditionally iterate over one of several possible iterators .

关于rust - 返回迭代器(或任何其他特征)的正确方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27535289/

相关文章:

rust - "type mismatch"在二维数组上循环

casting - 为什么不将 int 分配给 f32 变量编译?

html - 如何使用 Kuchiki 获取 HTML 文档的所有文本(除了 script/style/noscript 标签)?

rust - 错误 "cannot move out of borrowed content"的来源是什么?

rust - 为什么使用 "Self"作为参数类型会引发生命周期错误?

rust - 我可以禁用 Release模式的开发依赖功能吗?

rust - 为什么是'futures::prelude::*;未声明

rust - 如何明确说明关联类型应该是什么?

hashmap - 如何有效地从 HashMap 中查找和插入?

rust - 结果没有名为 "unwrap()"的方法?