如何根据 Pandas DataFrame 中存储的分类数据为巨大的特征向量 (50000 x 100000) 创建 CSR/COO 格式的稀疏矩阵?我正在使用 Pandas get_dummies() 函数创建特征向量,但它返回 MemoryError。我该如何避免这种情况,而是以稀疏矩阵 CSR 格式生成它?
最佳答案
可能有用的链接:
Populate a Pandas SparseDataFrame from a SciPy Sparse Matrix
http://pandas.pydata.org/pandas-docs/stable/sparse.html
Pandas sparse dataFrame to sparse matrix, without generating a dense matrix in memory
关于python - 以 CSR/COO 格式为存储在 Pandas DataFrame 中的分类数据的巨大特征向量创建稀疏矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33617987/