python - 我正在获取 AttributeError : 'list' object has no attribute 'lower' while trying to split ("") on text data

我正在尝试对文本数据进行矢量化，但出现了错误

AttributeError: 'list' object has no attribute 'lower'

我的代码:

yourResult = [str(sentence).split(' ') for sentence in tag_data["Tags"]]

vectorizer = CountVectorizer()
tag_dtm = vectorizer.fit_transform(yourResult)#tag.apply(lambda x: str(x).split(" ")))

最佳答案

正如问题所述，yourResult 是一个列表列表，因为 split(' ') 返回一个列表，而它应该是一个字符串列表。 CountVectorizer 会为您进行分割，因此无需提前进行。这应该可以正常工作:

tag_dtm = vectorizer.fit_transform(tag_data["Tags"])

如果您想完全控制 CounVectorizer 内部的拆分工作方式，您可以提供自己的分词器:

vectorizer = CountVectorizer(tokenizer=lambda s: s.split(' '))
tag_dtm = vectorizer.fit_transform(tag_data["Tags"])

关于python - 我正在获取 AttributeError : 'list' object has no attribute 'lower' while trying to split ("") on text data，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54779884/

上一篇：python - 在 Python 中指定二进制值的开始和结束

下一篇：python - 如何找到 Spark 数据框中所有列的最大值

相关文章：

c# - WPF - 将列表添加到树中的好方法

python - 以迭代和递归的方式交换列表中的对 -Python3

python - 在列表中添加元组元素

python - 在列表理解中迭代列表的一部分

javascript - 此 PaymentMethod 之前使用过但未附加到客户或已与客户分离，并且可能不会再次使用

c# - 如何在 SharePoint 2010 中设置 SPField 的内部名称？

python - 您如何使用另一个包含列表的列表来排序包含列表的列表？

javascript - 如何在 Google AppEngine 上实现 "real time"消息传递？

python - Django Paginate CPU 时间缩放与选定对象未显示对象的数量

python - 扩展逻辑语句(相乘)