python - 为什么我在原始来源列表中找不到这些单词？

我试图在两个不同的文件中查找中文单词，但它不起作用，所以我尝试在从中获取它们的同一个文件中搜索单词，但似乎也找不到它？这怎么可能？

chin_split = codecs.open("CHIN_split.txt","r+",encoding="utf-8")

二手this正则表达式代码。

import re
for n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read()):
    print n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read())

为什么我只打印了false？？？

仅供引用，我尝试这样做并且它有效:

for x in [1,2,3,4,5,6,6]:
    print x in [1,2,3,4,5,6,6]

顺便说一句

chin_split 包含英语希伯来语和中文单词

来自 chin_split.txt 的一些行:

 he daodan   核导弹     טיל גרעיני     
 hedantou    核弹头     ראש חץ גרעיני      
 helu    阖庐  "ביתו, מעונו 
 helu    阖庐   שם מלך וו בתקופת ה'אביב והסתיו'"      
 huiwu   会晤  להיפגש עם

最佳答案

您多次读取文件描述符，这是错误的。

第一个 chin_split.read() 将产生所有内容，但其他内容(循环内)只会得到一个空字符串。

该循环没有意义，但如果您想保留它，请先将文件内容保存在变量中。

关于python - 为什么我在原始来源列表中找不到这些单词？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12121617/

上一篇：python - 无法将转储的 JSON 文件读回 Python

下一篇：python - 如何在 Python 中生成昨天和今天午夜的 POSIX 值？

相关文章：

python - 无法从桌面上看到的 excel 中读取数据

python - 将 Plotly 交互式图表嵌入博客而不丢失动画

javascript - 帮助正则表达式 - 我怎样才能让一些网址不跟随？

regex - 如何在没有灾难性回溯的情况下编写此正则表达式

Python PEP 273 和 Amazon BotoCore

Python "Segmentation fault: 11"运行时 "import cv"或 "import cv2"

python - Tornado 。类似 Django 的测试运行器和测试数据库

python - Python 与其他脚本语言相比如何？

python - 使用最常见的值更改 numpy 数组的结构

java - 如果前面没有其他内容，则用于匹配某些内容的正则表达式