C# 存储输入文件中的字符串以供操作和使用的最佳方式?

标签 c# string file filereader

我有一个字符串 block 文件,每个字符串 block 都以特定关键字结尾。我目前有一个流阅读器设置,它将文件的每一行添加到列表中,直到当前 block 的末尾(行包含指示 block 结束的关键字)。

listName.Add(lineFromFile);

每个 block 都包含信息,例如书籍 bookName、作者 AuthorName、期刊 JournalName 等。所以每个 block 假设是一个项目(书籍、期刊、 session 等)。

现在有大约 50 block 左右的信息(项目),我需要一些方法来存储信息,以便我可以操作它并存储每个作者、标题、页面等,并知道什么信息与什么项目等.

在打字时,我想到了可能将每个 Item 存储为名为“Item”的类的对象的想法,但是可能有多个作者,我不确定如何实现这一点,正如我在想的那样也许使用计数器来命名变量,例如

int i = 0;
String Author[i] = "blahblah";
i++;

但据我所知这是不允许的?所以我的问题基本上是什么是存储每个项目的最简单/最简单的方法,以便我可以操纵字符串来存储每个项目以供以后使用。

@yamen 这是文件的示例:

Author Bond, james
Author Smith John A
Year 1994
Title For beginners
Book Accounting
Editor Smith Joe
Editor Doe John
Publisher The University of Chicago Press
City Florida, USA
Pages 15-23
End

Author Faux, M
Author Sedge, M
Author McDreamy, L
Author Simbha, D
Year 2000
Title Medical advances in the modern world
Journal Canadian Journal of medicine
Volume 25
Pages 1-26
Issue 2
End


Author McFadden, B
Author Goodrem, G
Title Shape shifting dinosaurs
Conference Ted Vancouver
City Vancouver, Canada
Year 2012
Pages 2-6
End

最佳答案

更新代替您的样本

如何解析字符串超出了这个答案的范围 - 你可能想自己尝试一下,然后问另一个 SO(我建议阅读 SO 的黄金法则:https://meta.stackexchange.com/questions/128548/what-stack-overflow-is-not)。

因此,我将假设您有一个字符串表示完整的书籍/期刊信息 block (此数据看起来像引文),然后介绍解决方案。我原来的回答的主要变化是你有多个作者。此外,您可能还需要考虑是否要将作者姓名转换回 [first name/initial] [middle names] [surname] .

我提出了两个解决方案 - 一个使用 Dictionary和一个使用 Linq . Linq 解决方案是单行的。

定义一个 Info存储项目的类:

public class Info
{
   public string Title { get; private set; }
   public string BookOrJournal { get; private set; }
   public IEnumerable<string> Authors { get; private set; }
   //more members of pages, year etc.
   public Info(string stringFromFile)
   {
     Title = /*read book name from stringFromFile */;
     BookOrJournalName = /*read journal name from stringFromFile */;
     Authors = /*read authors from stringFromFile */;
   }
}

请注意 stringFromFile应该是引用信息的一个 block ,包括换行符。

现在一个字典来存储每个作者的信息:

Dictionary<string, List<Info>> infoByAuthor = 
  new Dictionary<string, List<Info>>(StringComparer.OrdinalIrgnoreCase);

注意 OrdinalIgnoreCase比较器 - 处理作者姓名以不同大小写打印的情况。

给定一个 List<string>你要根据你的 listName.Add 添加到,这个简单的循环就可以解决问题:

List<Info> tempList;
Info tempInfo;
foreach(var line in listName)
{
  if(string.IsNullOrWhiteSpace(line))
    continue;
  tempInfo = new Info(line);
  foreach(var author in info.Authors)
  {
    if(!infoByAuthor.TryGetValue(author, out tempList))
      tempInfo[author] = tempList = new List<Info>();
    tempList.Add(tempInfo);
  }
}

现在您可以遍历字典,并且每个 KeyValuePair<string, List<Info>>会有一个 Key等于作者姓名和 Value将是 Info 的列表具有该作者的对象。请注意 AuthorName 的大小写将从文件中保留,即使您不区分大小写地分组,这样两个项目带有 "jon skeet""Jon Skeet"将被分组到同一个列表中,但它们的原始案例将保留在 Info 上.

还编写了代码以确保只有一个 Info实例是根据引用创建的,出于多种原因(内存、集中更新等),这是更可取的。

或者,使用 Linq,您可以简单地执行以下操作:

var grouped = listName.Where(s => !string.IsNullOrWhiteSpace(s))
  .Select(s => new Info(s))
  .SelectMany(i => 
    s.Authors.Select(ia => new KeyValuePair<string, Info>(ia, i))
  .GroupBy(kvp => kvp.Key, kvp => kvp.Value, StringComparer.OrdinalIgnoreCase);

现在您有可枚举的组,其中 Key是作者姓名,内部可枚举是所有 Info具有该作者姓名的对象。此处也将观察到关于“两个双向飞碟”的相同大小写保留行为。

关于C# 存储输入文件中的字符串以供操作和使用的最佳方式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10594539/

相关文章:

c# - LINQ、输出参数和 'Use of Unassigned Local Variable' 错误

c# - 我如何锁定工具包 :LongListMultiSelector in selection mode?

java - 将字符串中的一个字符替换为 2 个字符

c++ - 如何在C++中使用<文件系统>访问相对父目录

java - 为什么对Path的操作要以静态方法的形式实现呢?

javascript - 如何在单个复选框事件上选中/取消选中所有 asp.net 复选框?

python - Python中int转string时如何指定格式?

java替换上一个()

android - 我如何在android中获取非媒体类型的uri及其id?

c# - 私有(private)方法和属性的 ReSharper C# 命名风格