Python - 如何删除某个符号后所有行中的所有字符？

我想删除所有行中 @ 符号之后的所有字符。我写了一段代码:

#!/usr/bin/env python
import sys, re, urllib2
url = 'http://varenhor.st/wp-content/uploads/emails.txt'
document = urllib2.urlopen(url)
html = document.read()

html2 = html[0]
for x in html.rsplit('@'):
    print x

但它只删除 @ 符号并将其余字符复制到下一行。那么我如何修改这段代码，删除 @ 之后所有行中的所有字符？我应该使用正则表达式吗？

最佳答案

你 split 的次数太多了；使用str.rpartition()相反，忽略 @ 之后的部分。每行执行此操作:

for line in html.splitlines():
    cleaned = line.rpartition('@')[0]
    print cleaned

或者，对于较旧的 Python 版本，将 str.rsplit() 限制为仅 1 个分割，并再次仅获取第一个结果:

for line in html.splitlines():
    cleaned = line.rsplit('@', 1)[0]
    print cleaned

我用了str.splitlines()无论换行样式如何，都可以干净地分割文本。您还可以直接循环 urllib2 响应文件对象:

url = 'http://varenhor.st/wp-content/uploads/emails.txt'
document = urllib2.urlopen(url)
for line in document:
    cleaned = line.rpartition('@')[0]
    print cleaned

演示:

>>> import urllib2
>>> url = 'http://varenhor.st/wp-content/uploads/emails.txt'
>>> document = urllib2.urlopen(url)
>>> for line in document:
...     cleaned = line.rpartition('@')[0]
...     print cleaned
... 
ADAKorb...
AllisonSarahMoo...
Artemislinked...
BTBottg...
BennettLee...
Billa...
# etc.

关于Python - 如何删除某个符号后所有行中的所有字符？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23984964/

Python - 如何删除某个符号后所有行中的所有字符？

上一篇：python - 如何删除空白的二维列表行？

下一篇：python读取文件操作