python - 如何忽略单词之间的空格而不是其他字符?

标签 python regex python-3.x

我想重命名一长串文件名,使它们更易于搜索。自动生成的名称因此存在一些奇怪的间距问题。我写了一个小的 python 脚本来做我想做的事。但我不想删除单词之间的空格。例如我有两个名字:

0 130 — HG — 1500 — 12"  (Page 1 of 2)  
01 30 — HD LOW POINT DRAIN  

他们应该阅读:

0130-HG-1500-12"  
0130-HD LOW POINT DRAIN  

到目前为止我的代码:

import os
import re

for filename in os.listdir("."):
    if not filename.endswith(".py"):
        os.replace(filename, re.sub("[(].*?[)]", "",  # Remove anything between ()
                                    "".join(filename.split()  # Remove any whitespaces
                                            ).replace("—", "-")))  # Replace Em dash with hyphen  

一切正常,除了我不知道如何不只去除单词之间的空格。

最佳答案

如果“单词”是指“由字母组成的字符串”,那么

re.sub('((?<=[^a-zA-Z]) | (?=[^a-zA-Z]))', '', filename)

会成功的。用通俗易懂的语言来说,就是“将非字母字符之后或之前的每个空格替换为空”。输出:

In [24]: re.sub('((?<=[^A-Z]) | (?=[^A-Z]))', '', '01 30 — HD LOW POINT DRAIN  ')
Out[24]: '0130—HD LOW POINT DRAIN'

In [25]: re.sub('((?<=[^A-Z]) | (?=[^A-Z]))', '', '0 130 — HG — 1500 — 12"')
Out[25]: '0130—HG—1500—12"'

关于python - 如何忽略单词之间的空格而不是其他字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48360628/

相关文章:

jQuery:如何用反斜杠转义单引号和双引号

JavaScript 正则表达式不替换 '@' 字符

python 3.X : Call Outside Variable In Nested For Loop

python - 如何在 go daddy linux 主机上使用 pip 安装 python 包(没有 root 访问权限)

python - 如何让它更像 Pythonic?

Python:在字符串中的某些字符后打印4个字符

python - 我如何在没有Restful Api的情况下使用Elasticsearch

python - 在 Python 3.2 testenv 上运行 tox + nosetests

python:从文件读取json数据并附加更多数据

python - 为什么在 LSTM 中添加 relu 激活后出现 Nan?