python - 为什么我在原始来源列表中找不到这些单词?

标签 python regex python-2.7

我试图在两个不同的文件中查找中文单词,但它不起作用,所以我尝试在从中获取它们的同一个文件中搜索单词,但似乎也找不到它?这怎么可能?

chin_split = codecs.open("CHIN_split.txt","r+",encoding="utf-8")

二手this正则表达式代码。

import re
for n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read()):
    print n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read())    

为什么我只打印了false???

仅供引用,我尝试这样做并且它有效:

for x in [1,2,3,4,5,6,6]:
    print x in [1,2,3,4,5,6,6]

顺便说一句

chin_split 包含英语希伯来语和中文单词

来自 chin_split.txt 的一些行:

 he daodan   核导弹     טיל גרעיני     
 hedantou    核弹头     ראש חץ גרעיני      
 helu    阖庐  "ביתו, מעונו 
 helu    阖庐   שם מלך וו בתקופת ה'אביב והסתיו'"      
 huiwu   会晤  להיפגש עם      

最佳答案

您多次读取文件描述符,这是错误的。

第一个 chin_split.read() 将产生所有内容,但其他内容(循环内)只会得到一个空字符串。

该循环没有意义,但如果您想保留它,请先将文件内容保存在变量中。

关于python - 为什么我在原始来源列表中找不到这些单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12121617/

相关文章:

python - 无法从桌面上看到的 excel 中读取数据

python - 将 Plotly 交互式图表嵌入博客而不丢失动画

javascript - 帮助正则表达式 - 我怎样才能让一些网址不跟随?

regex - 如何在没有灾难性回溯的情况下编写此正则表达式

Python PEP 273 和 Amazon BotoCore

Python "Segmentation fault: 11"运行时 "import cv"或 "import cv2"

python - Tornado 。类似 Django 的测试运行器和测试数据库

python - Python 与其他脚本语言相比如何?

python - 使用最常见的值更改 numpy 数组的结构

java - 如果前面没有其他内容,则用于匹配某些内容的正则表达式