python-2.7 - 统一码编码错误 : 'ascii' codec can't encode characters in position 62-11168: ordinal not in range(128)

标签 python-2.7 text nlp summarization bartender

帮我弄清楚这是怎么回事。我正在使用 Transformers 运行文本摘要

~/Bart_T5-summarization$ python app.py 找不到记录器“transformers.data.metrics”的处理程序 追溯(最近一次通话): 文件“app.py”,第 6 行,位于 从变压器导入 BartTokenizer、BartForConditionalGeneration、BartConfig 文件“/home/darshan/.local/lib/python2.7/site-packages/transformers/init.py”,第 42 行,位于 从 .tokenization_auto 导入 AutoTokenizer 文件“/home/darshan/.local/lib/python2.7/site-packages/transformers/tokenization_auto.py”,第 28 行,位于 从 .tokenization_xlm 导入 XLMTokenizer 文件“/home/darshan/.local/lib/python2.7/site-packages/transformers/tokenization_xlm.py”,第 27 行,在 将 sacremoses 导入为 sm 文件“/home/darshan/.local/lib/python2.7/site-packages/sacremoses/init.py”,第 2 行,在 从 sacremoses.tokenize 导入 * 文件“/home/darshan/.local/lib/python2.7/site-packages/sacremoses/tokenize.py”,第 16 行,位于 类 MosesTokenizer(对象): 文件“/home/darshan/.local/lib/python2.7/site-packages/sacremoses/tokenize.py”,第 41 行,在 MosesTokenizer 中 PAD_NOT_ISALNUM = r"([^{}\s.'`\,-])".format(IsAlnum), r"\1 "

enter image description here UnicodeEncodeError:“ascii”编解码器无法对位置 62-11168 中的字符进行编码:序号不在范围内 (128)

最佳答案

用 python3 而不是 python 运行命令为我解决了这个问题。我能够运行代码并获得摘要。

关于python-2.7 - 统一码编码错误 : 'ascii' codec can't encode characters in position 62-11168: ordinal not in range(128),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61217394/

相关文章:

text - 我怎样才能使用格式! no_std 环境中的宏?

python - WordNet Python 单词相似度

python - 印度语 NLTK CorpusReader

python - nltk下载url授权问题

python - 如何将文件的第一行打印为列表?

python dask dataframe将元组列拆分为两列

python - 在 pdfminer.six python 中保留提取文本的布局

C++ 程序在大型 .TXT 文件中缺少搜索字符串。适用于较小的 .TXT 文件

python - MultiheadAttention 中的 attn_output_weights

java - Popen.communicate() 无法正常工作