Python 计数器，用于计算输出中列出的最常见字符串

嘿，大家好，我一直在编写这段代码来计算文本文档中出现的字符串数量，这是我之前的问题，代码如下所示:

from collections import Counter
with open("C:\\Documents and Settings\\Zha\\Desktop\\stringResult\\sguresult_lenght10.txt") as f:
    content = f.read()
a = Counter(content.split()).most_common()    
for line in a:
        print line

打印行的结果示例如下

('KERNEL32.dll', 58)
('not', 49)
('.data', 49)
("nRX|'", 20)
('xZGVr', 20)
('TyN*u', 20)
('[Wu^D', 20)

逗号之前的部分是字符串，接下来的部分是出现的次数现在的问题是我需要删除外面的所有括号和中间的 ' ' 单引号，只留下字符串和数字，即

KERNEL32.dll, 58
not, 49
.data, 49
etc

我一直在尝试使用正则表达式，但似乎我可能会弄错模式，因为单引号有时是字符串本身的第一部分。有什么简单的方法可以解决这个问题吗？谢谢

最佳答案

你可以使用这个:

for line in a:
    print '%s, %s' % (line[0], line[1])

关于Python 计数器，用于计算输出中列出的最常见字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24040207/

上一篇：python 使用 if 语句编辑文件

下一篇：python - PyAudio 和缓冲区溢出

相关文章：

Python线程转储

Python 和 Mechanize : How to scrape through pages in a row?

python - 使用 Pandas 合并多个 CSV 文件以创建具有动态 header 的最终 CSV 文件

python - 谁能告诉我为什么我收到 IndexError : list index out of range?

regex - minizinc pentominoes 常规约束示例如何工作？

python - Python 段错误？

python - easy-install.pth 和 *.egg-link 中冗余条目背后的动机是什么？

php - 使用 PHP 确保字符串只包含数字、字母和下划线？

python - 两个常量字符串之间的正则表达式匹配文本

Python 迭代 cx_Oracle 结果集时出错