python - 在 cygwin 中列出文件内容时遇到问题

标签 python linux windows cygwin

上下文:我想通过 python 脚本在远程 Windows 机器上安装“.msi”文件。

我已经在远程 Windows 机器上安装了 cygwin,并且 ssh 服务正在运行。我使用 python 脚本从 Linux 主机在远程 Windows 机器上通过 ssh 执行命令。为了安装 msi 文件,我使用了以下命令:

msiexec/package "msi file name"/quiet/norestart/log "log file name (say inSTLog.log)"

现在,为了验证安装是否成功,我列出了日志文件 (inSTLog.log) 的内容并检查字符串“安装成功或错误状态:0”。

问题:

“type”命令在 cygwin 中不起作用。所以我尝试了“cd {0}; cat {1} | tail -5”.format(FileLocation, FileName) 来列出文件内容,但我得到的输出格式不同,python 脚本无法匹配上面提到的输出字符串。这是我想在控制台上显示的:

MSI (s) (64:74) [18:03:51:360]:Windows Installer 安装了产品。产品名称:pkg-名称。产品版本:0.2.24-10891。产品语言:1033。制造商:XYZ 公司。安装成功或错误状态:0.

我实际得到的是:

M S I ( s ) ( 6 4 : 7 4 ) [ 1 8 : 0 3 : 5 1 : 3 6 0 ] : W i n d o w s I n s t a l e r i n s t a l e d the pro d u c t 。产品名称:p k g-n ame。产品版本:0。 2. 2 4 - 1 0 8 9 1 。产品语言:1 0 3 3。制造商:X Y Z 公司。安装成功或统计信息:0 .

因此在输出中的每个字符之后以某种方式引入了一个额外的空格。我想知道如何以正常方式而不是空格分隔格式获得输出。谢谢。

最佳答案

问题是 msiexec 以 Unicode 格式保存了它的日志文件。在 Windows 中,Unicode 由 2 个字符组成(意味着您看到的每个字符都以 2 个字节或字符的形式存储在内存中):第一个是代码页编号,第二个是该代码页中字符的条目(即字符本身).因为您运行的是英文版本,所以代码页编号为 0(或 \0\x00NULL)。一些流行的编辑器足够聪明,可以计算出编码并只显示字符(将交错的 NULL 字符放在一边)。现在有一些方法可以解决这个问题。

  • 升级 cygwin。在我的电脑上(我也安装了 Cygwin)我没有遇到这个问题(我的 Cygwin 使用的是:GNU coreutils 8.15 - 这可以通过键入 tail --version 来查看)。以下是一些输出(我在末尾包含了 hexdump 以向您展示该文件是 unicode 格式):

    cat unicode.txt
    

    产量:unicode 字符

    tail unicode.txt
    

    产量:unicode 字符

    hexdump unicode.txt
    

    产量:

    0000000 0075 006e 0069 0063 006f 0064 0065 0020
    0000010 0063 0068 0061 0072 0073 000d 000a
    000001e
    
  • 将 msiexec 日志转换为 ASCII 格式。我不知道有任何本地工具可以执行此操作,但您可以在 Google 上搜索 unicode to ascii converter 并下载这样的工具;或者正如我之前提到的,有理解 unicode 的编辑器,我已经尝试过并且能够将文件从 unicode 转换为 ascii 的编辑器是 Textpad ;或者您可以自己编写工具。

  • 如果您从 python 读取 msi 日志文件,您可以从脚本中处理 unicode 文件。我假设您有一些读取文件内容的代码,例如(!!!我没有包含任何异常处理!!!):

    f = open("some_msi_log_file.log", "rb")
    text = f.read()
    f.close()
    

    并且您正在对 text 进行处理。如果将上面的代码修改为:

    f = open("some_msi_log_file.log", "rb")
    unicode_text = f.read()
    f.close()
    text = "".join([char for char in unicode_text if char != '\x00'])
    

text 将不再包含 \x00(并且也可用于常规 ASCII 文件)。

关于python - 在 cygwin 中列出文件内容时遇到问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30751882/

相关文章:

python - python函数/方法调用有什么静态的吗?

c - 通过 setcontext 从信号处理程序返回

linux - Bash 测试并执行目录模式是否存在

python - 如何在 Windows 上安装 PyCairo(Python 的 Cairo)?

python - 在 Python 中循环遍历数字

python - 无法成功将 stdout 从 Popen 重定向到临时文件

python - Pandas :如何 groupby/pivot 保留 NaNs?将 float 转换为 str 然后再转换回 float 有效但看起来很复杂

android - 如何将android移植到ARM9处理器上的设备?

java - Docker 中的 Eclipse IDE

android - 在 Windows 中通过代理在 Android 中启用 Internet 连接