Rust的迭代器——collect

概述: 它能够将一个迭代器转换为各种集合类型,例如向量、哈希集、哈希映射等,能够将迭代器的所有元素收集到一个集合中

常见的用法:

将迭代器转换为Vec:

1
let Vec: Vec<i32> = (1..5).collect();

将迭代器转换为HashSet:

1
2
3
use std::collections::HashSet;

let set: HashSet<i32> = vec![1,2,3,2].into_iter().collect();

将迭代器转换为HashMap:

1
2
3
use std::collections::HashMap;

let map: HashMap<&str, i32> = vec![("a", 1), ("b", 2), ("c", 3)].into_iter().collect();

collect的类型推导:

collect是泛型的,通常需要通过上下文推导出类型目标,但是有时,如果没有足够的上下文,rust无法推导出目标类型,可能需要显式指定。

1
let numbers = (1..4).collect::<Vec<i32>>();

内部工作原理:

collect之所以通用,是因为它依赖于FromIterator trait,该trait定义了如何从一个迭代器构建某个集合类型。Vec、HashMap、HashSet等类型都实现了FromIterator

FromIterator定义如下:

1
2
3
pub trait FromIterator<A> {
fn from_iter<T: IntoIterator<Item = A>>(iter: T) -> Self;
}

常见的使用场景:

  1. 可以使用filter_map结合collect,从一个可能包含None的迭代器中收集有效的值

    1
    2
    3
    let values = vec![Some(1), None, Some(2), Some(3)];
    let result: Vec<i32> = values.into_iter().filter_map(|x| x).collect();
    println!("{:?}", result); // 输出: [1, 2, 3]
  2. 去重和排序:将元素收集到HashMap中去重,再收集到Vec来排序

    1
    2
    3
    4
    5
    6
    7
    use std::collections::HashSet;

    let vec = vec![3, 1, 2, 1, 3, 4];
    let mut set: HashSet<_> = vec.into_iter().collect();
    let mut vec: Vec<_> = set.into_iter().collect();
    vec.sort();
    println!("{:?}", vec); // 输出: [1, 2, 3, 4]
  3. 将字符迭代器收集为字符串:

    1
    2
    3
    let chars = vec!['R', 'u', 's', 't'];
    let s: String = chars.into_iter().collect();
    println!("{}", s); // 输出: Rust

性能考虑:

collect通常是高效的,因为它能够预知迭代器的大小并进行优化,提前分配足够的空间,避免不必要的内存重新分配。此外,对于较大的数据集,rust还可以通过并行化迭代器(rayon crate)来进一步提升性能。


Rust的迭代器——collect
http://example.com/2024/10/05/rust的迭代器——collect/
作者
凌云行者
发布于
2024年10月5日
许可协议