c# 在运行时存储大量数据的最佳方式

标签 c# performance datatable storage

在我的应用程序中,我有很多小文件保存在特定的路径结构中。我正在创建一个容器文件,我想在其中存储所有现有文件,这些文件以包含每个文件的偏移量或文件大小等信息的 header 开头。我正在使用 BinaryWriter 写入此文件。但是有很多重复项只添加到我的容器文件中一次。因此,我为每个文件创建一个哈希值,并将其与数据表中的现有哈希值进行比较。这就像它应该的那样工作,但我想知道这是否是一个好习惯,因为可能会有大量数据。是否有更好或更有效的方法来实现我的目标?

这是我的实际代码:

// I parsed through my files and created my header
// all file paths were added to my tileList
DataTable dtImageInfos = new DataTable();
dtImageInfos.Columns.Add("tilename", typeof(String));
dtImageInfos.Columns.Add("hash", typeof(String));
dtImageInfos.Columns.Add("offset", typeof(long));

foreach (String tile in tileList)
{                            
    FileInfo f = new FileInfo(tile);
    int tileSize = Convert.ToInt32(f.Length);

    if (tileSize <= MAX_CHECK_SIZE)
    {
        Image tileImg = Image.FromFile(tile);
        String tileHash = createHashForImage(tileImg);
        DataTable dtCheck = dtImageInfos.Clone();                                 

        if (dtImageInfos.Rows.Count > 0)
            dtImageInfos.AsEnumerable().Where(t => t.Field<String>("hash").Equals(tileHash))
                            .CopyToDataTable(dtCheck, LoadOption.OverwriteChanges);c#                                

        if (dtCheck.Rows.Count == 0)
        {
            writer.Write(tileOffset);

            DataRow drNew = dtImageInfos.NewRow();
            drNew["tilename"] = tile;
            drNew["hash"] = tileHash;
            drNew["offset"] = tileOffset;
            dtImageInfos.Rows.Add(drNew);

            tileOffset += tileSize;
        }
        else
        {
            DataRow drCheck = dtCheck.Rows[0];
            writer.Write((long)drCheck["offset"]);
        }              
    }
    else
    {
        writer.Write(tileOffset);

        DataRow drNew = dtImageInfos.NewRow();
        drNew["tilename"] = tile;
        drNew["hash"] = "";
        drNew["offset"] = tileOffset;
        dtImageInfos.Rows.Add(drNew);

        tileOffset += tileSize;
    }
    writer.Write(tileSize);                            
}

foreach (DataRow drTile in dtImageInfos.Rows)
{
    byte[] tileData = File.ReadAllBytes(drTile["tilename"].ToString());
    writer.Write(tileData);
}

我希望我能让我的问题变得容易理解。提前致谢

最佳答案

使用最新版本的 c#.NET,您只需使用 Zip 文件即可避免大量开销。

System.IO.Compression.ZipFile.CreateFromDirectory(folderPathWithTiles, containerPath);

您可以使用 .OpenRead 方法访问 zip 存档(容器文件)中的不同文件(tiles)。

using (ZipArchive tiles = ZipFile.OpenRead(containerPath))
{
    ZipArchiveEntry tile = tiles.GetEntry(relativeTilePath);
    Image tileImage = Image.FromStream(tile.Open());
}

压缩文件: http://msdn.microsoft.com/en-us/library/system.io.compression.zipfile.aspx

压缩存档: http://msdn.microsoft.com/en-us/library/system.io.compression.ziparchive.aspx

压缩存档条目: http://msdn.microsoft.com/en-us/library/system.io.compression.ziparchiveentry.aspx

关于c# 在运行时存储大量数据的最佳方式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17725682/

相关文章:

c# - 正则表达式不能在土耳其语字符上正常工作

c# - 在ConcurrentQueue中入队和TryDequeue

c# - 获取 Azure AD 访问 token 到期日期的正确方法

c++ - C++中的递归真的那么慢吗?

c++ - LookupAddressForName 做什么,为什么这么慢

javascript - 为数据表中的行添加 id

jquery - 为什么 jQuery DataTables 国际化 i18n 对我不起作用?

c# - 使用c#按创建日期过滤文件

mysql - 为什么 WHERE 子句中具有不同外键的相同 SQL 查询会获得不同的性能?

c# - System.InvalidCastException : Unable to cast object of type 'System.Double' to type 'System.Int32' in code