我已经在工作中使用一些程序大约一个月了,其中有很多字符串解析等工作。有人建议我使用字符数组而不是字符串来处理这些内容,因为字符数组更快。我明白为什么 char 数组很快,但是字符串类型使它变慢的原因是什么?它实现了什么数据结构?有什么方法可以使其像 char 数组一样快?
最佳答案
最明显的区别是 string
是不可变的。因此您无法修改其中的部分内容,并且需要在每次修改时创建一个全新的副本。
String 本身有一个非常特殊的实现(它是一个可变大小的类)并且不受数组支持。我认为对字符串中的 char
进行只读访问没有理由会很慢。
因此,如果您想更改字符串的一小部分,则需要使用 StringBuilder
或 char[]
。这两个 char[]
更快,因为 StringBuilder
有额外的验证和间接。但由于这是一个实现细节, self 上次测试以来它可能已经发生了变化。
刚刚对其进行了基准测试,从 .NET 4 开始,设置 char[]
成员的速度大约是 StringBuilder
的四倍。但两者每秒都可以执行超过 2 亿次作业,因此在实践中这并不重要。
从 char[]
读取比从 string
读取稍快(我的测试代码为 25%)。另一方面,从 StringBuilder
读取比从 char[]
读取要慢(3 倍)。
在所有基准测试中,我忽略了其他代码的开销。这意味着我的测试有点低估了差异。
我的结论是,虽然 char[]
比其他替代方案更快,但只有在每秒超过数百兆字节时才重要。
//Write StringBuilder
StringBuilder sb = new StringBuilder();
sb.Length = 256;
for(int i=0; i<1000000000; i++)
{
int j = i&255;
sb[j] = 'A';
}
//Write char[]
char[] cs = new char[256];
for(int i=0; i<1000000000; i++)
{
int j = i&255;
cs[j] = 'A';
}
// Read string
string s = new String('A',256);
int sum = 0;
for(int i=0; i<1000000000; i++)
{
int j = i&255;
sum += s[j];
}
//Read char[]
char[] s = new String('A',256).ToCharArray();
int sum = 0;
for(int i=0; i<1000000000; i++)
{
int j = i&255;
sum += s[j];
}
//Read StringBuilder
StringBuilder s= new StringBuilder(new String('A',256));
int sum = 0;
for(int i=0; i<1000000000; i++)
{
int j = i&255;
sum += s[j];
}
(是的,我知道我的基准代码不是很好,但我不认为它有很大的区别。)
关于.net - 字符串类型 .NET 与 char 数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6650699/