performance - 有效地将逗号分隔值字符串转换为字节

标签 performance python-3.x encode

我的python3程序正在从其他地方接收数据作为以下格式的字符串(...意味着我需要输入更多数据):

data = "0,12,145,234;1,0,0,128;2,255,255,255;...;909,100,100,100;"

我想将其转换为打包的二进制数据,其中忽略 ; 字符。目前,我正在做以下事情:

splitData = data.split(';')[:-1] # ignore the last ';'
buff = []
for item in splitData:
    addr, R, G, B = item.split(',')
    addr = int(addr) # two bytes
    R    = int(R)    # one byte
    G    = int(G)    # one byte
    B    = int(B)    # one byte
    packed = struct.pack('HBBB', addr, R, G, B)
    buff.append(packed)
dataBytes = b''.join(buff)

对于上面的示例数据,此过程给出以下内容:

dataBytes = b'\x00\x00\x0c\x91\xea\x01\x00\x00\x00\x80...\x8d\x03ddd'

这就是我想要的(大约是原始字符串大小的三分之一)。

但是,此过程大约需要 0.002 秒。我需要每帧执行此过程 33 次,这导致计算时间约为 0.05 秒,相当于每秒约 20 帧。如果可能的话,我想加快速度。

有没有一种方法可以比上面的方法更快地从字符串数据转换为字节数据?

最佳答案

使用 itertools,先进行替换,然后拆分,映射到 int,最后压缩成四部分,速度大约快 25%:

 In [82]: data = "0,12,145,234;1,0,0,128;2,255,255,255;909,100,100,100;" * 1000
 In [83]: from itertools import  imap, izip
 [84]: %%timeit  
splitData = data.split(';')[:-1] # ignore the last ';'
buff = []
for item in splitData:
    addr, R, G, B = item.split(',')
    addr = int(addr) # two bytes
    R    = int(R)    # one byte
    G    = int(G)    # one byte
    B    = int(B)    # one byte
    packed = struct.pack('HBBB', addr, R, G, B)
    buff.append(packed)
dataBytes = b''.join(buff)
   ....: 
100 loops, best of 3: 8.61 ms per loop

In [85]: %%timeit     
mapped = imap(int, data[:-1].replace(";", ",").split(","))
b"".join([struct.pack('HBBB', *sub) for sub in izip(mapped, mapped, mapped, mapped)])
   ....: 
100 loops, best of 3: 6.27 ms per loop

使用python3,只需使用map和zip:

In [4]: %%timeit
mapped = map(int, data[:-1].replace(";", ",").split(","))
b"".join([struct.pack('HBBB', *sub) for sub in zip(mapped, mapped, mapped, mapped)])
   ...: 
100 loops, best of 3: 3.61 ms per loop

In [5]: %%timeit        
splitData = data.split(';')[:-1] # ignore the last ';'
buff = []                                                                  for item in splitData:
    addr, R, G, B = item.split(',')
    addr = int(addr) # two bytes
    R    = int(R)    # one byte
    G    = int(G)    # one byte
    B    = int(B)    # one byte
    packed = struct.pack('HBBB', addr, R, G, B)
    buff.append(packed)
dataBytes = b''.join(buff)
   ...: 
100 loops, best of 3: 4.89 ms per loop

关于performance - 有效地将逗号分隔值字符串转换为字节,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37847220/

相关文章:

java - 在性能方面,double 数组比 java 中的自定义类更好还是更差?

performance - 是否所有算法都以 n 为基数(例如 : k^n) of the same time complexity?

performance - Tornado AsyncHTTPClient 请求在中等负载下超时

python - Fabric:在停止的进程上执行 "systemctl status"

mysql - 获取python mysql连接器执行的命令

performance - 为什么golang比scala慢?

python-3.x - Pandas Group By 和 Get Dummies

python - 当我使用 json.loads 时,你是什么?

android - 在Android中编码为Ogg vorbis时是否有延迟时间?

php - PHP中如何解析字符