rust - 将工作代码提取到单独的函数中时的生命周期问题

标签 rust lifetime borrowing

我正在编写一个程序来从日志文件(文本格式)中提取信息。整体流程是

  1. 将文件逐行读入 String
  2. 创建 ParsedLine从该行借用几个字符串切片的结构(一些使用 Cow )
  3. 使用ParsedLine写入 CSV 记录。

到目前为止一切顺利,但我遇到了一个我不明白的问题,我认为它与生命周期或数据流分析有关。问题出在我尝试进行的小重构上。

我有这个有效的功能:

fn process_line(columns: &[Column], line: String,  writer: &mut Writer<File>) {
    let parsed_line = ParsedLine::new(&line);

    if parsed_line.is_err() {
        let data = vec![""];
        writer.write_record(&data).expect("Writing a CSV record should always succeed.");
        return;
    }

    let parsed_line = parsed_line.unwrap();
    // let data = output::make_output_record(&parsed_line, columns);

    // The below code works. But if I try to pull it out into a separate function
    // Rust will not compile it.
    let mut data = Vec::new();

    for column in columns {
        match column.name.as_str() {
            config::LOG_DATE => data.push(parsed_line.log_date),
            config::LOG_LEVEL => data.push(parsed_line.log_level),
            config::MESSAGE => data.push(&parsed_line.message),

            _ => {
                let ci_comparer = UniCase::new(column.name.as_str());
                match parsed_line.kvps.get(&ci_comparer) {
                    Some(val) => {
                        let x = val.as_ref();
                        data.push(x);
                    },
                    None => data.push(""),
                }
            },
        }
    }

    writer.write_record(&data).expect("Writing a CSV record should always succeed.");
}

但我想提取出构造 data 的那部分代码放入一个单独的函数中,以便我可以更轻松地对其进行测试。函数如下:

pub fn make_output_record<'p, 't, 'c>(parsed_line: &'p ParsedLine<'t>, columns: &'c [Column]) -> Vec<&'t str> {
    let mut data = Vec::new();

    for column in columns {
        match column.name.as_str() {
            config::LOG_DATE => data.push(parsed_line.log_date),
            config::LOG_LEVEL => data.push(parsed_line.log_level),
            config::MESSAGE => data.push(&parsed_line.message),

            _ => {
                let ci_comparer = UniCase::new(column.name.as_str());
                match parsed_line.kvps.get(&ci_comparer) {
                    // This is the problem here. To make it explicit:
                    //     val is a "&'t Cow<'t, str>" and x is "&'t str"
                    Some(val) => {
                        let x = val.as_ref();
                        data.push(x);
                    },
                    None => data.push(""),
                }
            },
        }
    }

    data
}

我得到的错误是:

error[E0623]: lifetime mismatch                                                                                                                                                                                      
--> src/main.rs:201:5                                                                                                                                                                                             
    |                                                                                                                                                                                                                
177 | pub fn make_output_record<'p, 't, 'c>(parsed_line: &'p ParsedLine<'t>, columns: &'c [Column]) -> Vec<&'t str> {                                                                                                
    |                                                                                 ------------     ------------                                                                                                  
    |                                                                                 |                                                                                                                              
    |                                                                                 this parameter and the return type are declared with different lifetimes...                                                    
...                                                                                                                                                                                                                  
201 |     data                                                                                                                                                                                                       
    |     ^^^^ ...but data from `columns` is returned here                                                                                                                                                           

编译器认为返回的向量包含来自Columns的信息,但是Columns实际上只用于获取列的名称,然后用于在 kvps 中查找值HashMap(UniCase 用于使查找不区分大小写)。如果找到一个值,我们添加 &strdata .

所以我不明白为什么编译器认为来自 Columns 的东西结束于 data ,因为在我看来Columns只是一些用于驱动 data 最终内容的元数据, 但本身并没有出现在 data 中.一旦kvps查找完成,我们得到值 Columns也可能不存在。

我尝试了各种方法来解决这个问题(包括为所有内容添加明确的生命周期、删除一些生命周期以及添加各种超出生命周期的规范)但似乎没有任何组合能够告诉编译器 Columns未用于 data .

作为引用,这里是 ParsedLine 的定义:

#[derive(Debug, Default, PartialEq, Eq)]
pub struct ParsedLine<'t> {
    pub line: &'t str,
    pub log_date: &'t str,
    pub log_level: &'t str,
    pub message: Cow<'t, str>,
    pub kvps: HashMap<UniCase<&'t str>, Cow<'t, str>>
}

请注意,我拒绝删除 Cows :我认为这会解决问题,但 String 分配的数量可能会增加 20 倍,我想避免这种情况。当前的程序快得惊人!

我怀疑问题实际上出在 UniCase<&'t str> 上我需要给 key 它自己的生命周期。不确定如何。

所以我的问题是

  • 为什么我不能轻松地将此代码移动到新函数中?
  • 我该如何解决?

我明白这是一个相当长的问题。在本地修改代码可能更容易。它在 Github 上,错误应该可以重现:

git clone https://github.com/PhilipDaniels/log-file-processor
git checkout 80158b3
cargo build

最佳答案

process_line 调用 make_output_record 将推断出 make_output_record 的生命周期参数。

pub fn make_output_record<'p>(parsed_line: &'p ParsedLine, columns: &'p [Column]) -> Vec<&'p str> {

这意味着 'p 是所有者将在 process_line 的范围内存活的生命周期(因为推断)。根据您的代码,parsed_linecolumns 位于 'p 中。 'p 是您的返回值和参数的共同生命周期。这就是您的代码无法正常工作的原因,因为 'p, 't,'c 对于参数和返回值并不常见。

我在 here 中简化了您的代码,这是工作版本,如果您将其他生命周期参数添加回 make_output_record,您可以恢复错误。

关于rust - 将工作代码提取到单独的函数中时的生命周期问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53868530/

相关文章:

rust - 指定 Rust 闭包生命周期

rust - 自定义并发映射结构上的“借用”借用问题

string - 获取字符串作为格式化输出中的值

server - 在后端找不到 openssl

rust - 在 Rust 中逐行读取大文件

generics - 如何在Rust中实现装饰器?

rust - 迭代递归结构时无法获取可变引用 : cannot borrow as mutable more than once at a time

macros - 为什么 Rust 找不到多语句宏中的变量?

string - Rust 中有没有像 JavaScript 的 substr 这样的方法?

iterator - 如何设置盒装闭包捕获 `self` 的生命周期?