如果我们将此 aaabccba
视为我们的输入字符串,则 baaacacb
将是对输入应用 Burrows-Wheeler 变换后的输出字符串。观察输出,您会看到两个聚集的 c
是分开的。很明显,输入字符串会产生比输出更好的压缩。
如何决定是否对输入字符串应用 Burrows-Wheeler 变换?我们可以进行某种快速分析来做出决定吗?
最佳答案
尝试用比 BWT 快得多的方法压缩它,例如lz4 ,看看它压缩了多少。然后,您可以根据您为应用程序得出的任何标准,通过实验为该比率设置一个阈值,高于该阈值时应用 BWT。
关于c - 在 Burrows-Wheeler 变换之前分析字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17259538/