我正在使用 KNN 对 IMDb 和 Youtube 电影预告片进行分类。 因为它有很多维度,所以我决定使用 TSNE。 但是,不断出现错误,提示:无法将字符串转换为 float :'Avatar'
这是我的代码。
import matplotlib.pyplot as plt
from sklearn.manifold import TSNE
model = TSNE(learning_rate=100)
transformed = model.fit_transform(df2)
xs = transformed[:,0]
ys = transformed[:,1]
plt.scatter(xs,ys,c=labels)
我认为我应该简单地删除“movie_title”列,这样我就只剩下 TSNE 的数字数据。有没有办法删除数据集中的特定列?
我的数据集列是:movie_title
、genres
、country
、range
、
总金额
、预算
、imdb_score
、观看次数
、评分
。
我已经尝试过 - table.Columns.Remove("movie_title"),但这似乎不起作用......
感谢您的阅读!
最佳答案
您可以使用df.drop()
。如果您的 DataFrame
名为 table
,请使用:
table.drop('movie_title', axis=1, inplace=True)
关于python - 有没有办法删除一列来执行 TSNE?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59242235/