python - 如何将Postgres bytea数据或Python memoryview对象转换为NumPy数组?

标签 python postgresql numpy opencv matplotlib

我有一个PostgreSQL数据库(v 9.6),其中图像存储为bytea数据。我不知道图像编码。 (我没有设置这个数据库,虽然我愿意,但是我不确定是否可以更改此设置,因为在PostgreSQL数据库中存储大图像不是(IIUC)的最佳做法。)

我想将这些数据提取到图像中,或者更好的是,直接提取到NumPy数组中。

使用SQLAlchemy,我可以连接并提取数据:

engine = create_engine(postgresql+psycopg2://user:password@server:port/database)
connection = engine.connect()
result = connection.execute('SELECT image FROM database.table LIMIT 1;')

有问题的图像作为memoryview对象返回;转换为numpy数组,看起来像这样(每个Cython: Convert memory view to NumPy array):
[b'\xaa' b'\x04' b'u' b'\x04' b'\x85' b'\x04' b'E' b'\x04' b'\x7f' b'\x04'
 b'\xa5' b'\x04' b'K' b'\x04' b'j' b'\x04' b'\x97' b'\x04' b';' b'\x04'
 b'w' b'\x04' b'k' b'\x04' b'E' b'\x04' b'b' b'\x04' b's' b'\x04']

我尝试保存为jpg或tiff文件(每个Converting BLOB, stored on a database, to an image on an HTML website),但无法使用图像查看器打开生成的文件。

我也尝试了这个(Open PIL image from byte file),但是得到了以下结果:
OSError: cannot identify image file <_io.BytesIO object at 0x000002299F4DD830>

或者,从How to convert hex string to color image in python?,出现此错误:
ValueError: non-hexadecimal number found in fromhex() arg at position 0

因此:如何将这个bytea数据或这个memoryview对象转换为NumPy数组?

我可能缺少一些简单的东西,或者这可能只是不应将图像存储在SQL数据库中的原因之一。

最佳答案

对于后代,这是我得出的最简单的解决方案。

最佳做法是不将图像存储在数据库中,而是在文件系统中存储多个版本(不同的分辨率,从缩略图(64x64 ish)到完整分辨率(在这种情况下为2504x2504),并带有这些图像的文件路径。可以按哈希(有些开销)或类似时间戳进行排序;后者对我们有用,因为所有数据都来自一台摄像机,因此具有不同的时间戳。

所讨论的数据是16位灰度TIFF文件。 Python图像库(PIL)无法转换这些图像。 OpenCV可以的。但是,由于无论如何我都想要一个NumPy数组,所以这并不重要。 MatPlotLib可以直接显示数组。 Numpy可以根据需要 slice 或下采样。

engine = create_engine('postgresql+psycopg2://user:pass@server:port/database')
connection = engine.connect()

query = 'SELECT * FROM database.schema.table WHERE "ID" = 1234'
result = connection.execute(query)

for row in result:
    data = row[-1] # our image is the last column in the table

connection.close()

从这里,numpymatplotlib可以起吊。我知道图像的分辨率,但是它也存储在数据库表的其他位置。
img_array = np.reshape(np.frombuffer(data, dtype="Int16"), (2504, 2504))

norm = cm.colors.Normalize(vmax=abs(img_array).max(), vmin=-abs(img_array).max())
plt.matshow(img_array, norm=norm, cmap="gray")
plt.show()
plt.imshow()也可以。

使用OpenCV,我们使用的代码是这样的:
cv2.namedWindow("Image", cv2.WINDOW_NORMAL | cv2.WINDOW_KEEPRATIO)
cv2.imshow("Image", img_array)
cv2.waitKey(0)
cv2.destroyAllWindows()

关于python - 如何将Postgres bytea数据或Python memoryview对象转换为NumPy数组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53160860/

相关文章:

python - 如何将 "label"附加到 numpy 数组

python - 如何在使用 open() 时禁用 Python 2.7 中的通用换行符

python - 使用 Python 和 Mechanize 接受条款和条件

postgresql - 在 PostgresQL 数据库中存储 Twitter Snowflake 字符串的最佳方法是什么?

java - 无法使用 Postgres 存储函数获取 ID - int 类型的值错误

database - postgres/pl sql generate string 创建额外的双引号

python - 更改DataFrame中某行的增量值

python - 在异步中触发并忘记任务

Python py2exe 一体机

python - 如何设置 numpy 数组的每个元素的 alpha 值