c# - 多个通配符目录/文件搜索 C# .net 中的任意目录结构

标签 c# .net search directory

我正在使用 C# 和 .net 4.0 在 Visual Studio 2012 中构建 Windows 应用程序。

该程序的功能之一是搜索所有满足给定搜索条件的文件,通常(但不总是)包含通配符。

搜索条件在运行时是未知的;它是从 Excel 电子表格导入的。

可能的搜索条件可以包括以下内容:

  1. 确切路径
    • "C:\temp\directory1\directory2\someFile.txt"
  2. 路径,文件名中包含通配符:
    • "C:\temp\directory1\directory2*.*"
  3. 文件名,路径中包含通配符:
    • "C:\temp*\directory*\someFile.txt"
  4. 带通配符的文件名和路径:
    • "C:\temp\*\*\*.*"
  5. 以上所有,具有任意目录结构:
    • "C:\temp\dir*1\dir*\anotherdir\*\another*\file*.txt"
    • "C:\te*\*\someFile.txt"
    • "C:\temp\*tory1\dire*2\*\*\*\*\*.*"

我尝试使用 Directory.EnumerateFiles:

IEnumerable<string> matchingFilePaths = System.IO.Directory.EnumerateFiles(@"C:\", selectedItemPath[0], System.IO.SearchOption.AllDirectories);

然而,这仅适用于上述情况 2。尝试在文件夹名称中使用带有通配符的 Directory.EnumerateFiles 会导致“非法字符”豁免。

我希望 .net 中有一个单行代码,我可以用它来进行文件搜索。通配符的数量和目录结构的深度在运行时是未知的,可以想象搜索可能必须深入到一百个文件夹,每个文件夹都包含未知数量的通配符。 (这是问题的关键)。尽量避免嵌套 for 循环的数量过多。

我阅读了解决方案 here但这似乎不适用于任意文件夹结构。

最佳答案

既然您已经回答了自己的问题,我想我会把我的尝试发布给可能发现这个问题但不想使用 powershell 的任何其他人。它全部延迟加载,因此在您拥有大型文件系统并匹配大量文件的情况下,它的性能将是最佳的。

示例用法:

string pattern = @"C:\Users\*\Source\Repos\*\*.cs";
foreach (var st in GetAllMatchingPaths(pattern))
    Console.WriteLine(st);

解决方案:

public static IEnumerable<string> GetAllMatchingPaths(string pattern)
{
    char separator = Path.DirectorySeparatorChar;
    string[] parts = pattern.Split(separator);

    if (parts[0].Contains('*') || parts[0].Contains('?'))
        throw new ArgumentException("path root must not have a wildcard", nameof(parts));

    return GetAllMatchingPathsInternal(String.Join(separator.ToString(), parts.Skip(1)), parts[0]);
}

private static IEnumerable<string> GetAllMatchingPathsInternal(string pattern, string root)
{
    char separator = Path.DirectorySeparatorChar;
    string[] parts = pattern.Split(separator);

    for (int i = 0; i < parts.Length; i++)
    {
        // if this part of the path is a wildcard that needs expanding
        if (parts[i].Contains('*') || parts[i].Contains('?'))
        {
            // create an absolute path up to the current wildcard and check if it exists
            var combined = root + separator + String.Join(separator.ToString(), parts.Take(i));
            if (!Directory.Exists(combined))
                return new string[0];

            if (i == parts.Length - 1) // if this is the end of the path (a file name)
            {
                return Directory.EnumerateFiles(combined, parts[i], SearchOption.TopDirectoryOnly);
            }
            else // if this is in the middle of the path (a directory name)
            {
                var directories = Directory.EnumerateDirectories(combined, parts[i], SearchOption.TopDirectoryOnly);
                var paths = directories.SelectMany(dir =>
                    GetAllMatchingPathsInternal(String.Join(separator.ToString(), parts.Skip(i + 1)), dir));
                return paths;
            }
        }
    }

    // if pattern ends in an absolute path with no wildcards in the filename
    var absolute = root + separator + String.Join(separator.ToString(), parts);
    if (File.Exists(absolute))
        return new[] { absolute };

    return new string[0];
}

PS:它不会匹配目录,只会匹配文件,但如果需要,您可以轻松修改它。

关于c# - 多个通配符目录/文件搜索 C# .net 中的任意目录结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36753047/

相关文章:

c# - 使用 x :Shared ="False" resources in external assembly in WPF 时出错

ios - 在 algolia 中搜索所有出现的字符串

c# - 从 "Application"向每个表单注册加载事件

c# - 如何在 Linq To SQL 中强制 varchar 长度

c# - WPF 中的内部 'border'

c# - 查询 XmlDocument 而不会出现 'Namespace prefix is not defined' 问题

c - C 中的数组 : Function which shows whether or not an array contains a certain element

php - 如何使用 AND 和 OR 条件创建 php 标签搜索字段?

c# - EntityFramework 6.0.0.0 读取数据,但不插入

c# - Npgsql + Dapper ExecuteReader