python - 以 CSR/COO 格式为存储在 Pandas DataFrame 中的分类数据的巨大特征向量创建稀疏矩阵

标签 python pandas matrix scipy statistics

如何根据 Pandas DataFrame 中存储的分类数据为巨大的特征向量 (50000 x 100000) 创建 CSR/COO 格式的稀疏矩阵?我正在使用 Pandas get_dummies() 函数创建特征向量,但它返回 MemoryError。我该如何避免这种情况,而是以稀疏矩阵 CSR 格式生成它?

最佳答案

关于python - 以 CSR/COO 格式为存储在 Pandas DataFrame 中的分类数据的巨大特征向量创建稀疏矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33617987/

相关文章:

python - 根据多个条件过滤数据框

java - 具有大量变异的矩阵的最佳数据结构

c++ - 在矩阵中寻找最长的递增路径

python - 有没有什么有效的方法可以将一个大列表的 RDD 分成几个列表而不执行收集

python - 什么时候 Py_INCREF?

python - UDP 数据包不适用于 scapy?

python - 乘以包含 NaN 的 Pandas 系列行

Python:cmd 在提示和空行时执行最后一条命令

Python - Pandas - 对特定子集的 dropna 调用期间出现关键错误

algorithm - 两个不等维矩阵相乘的时间复杂度是多少?