python - 从不同文件调用变量时数组值存在差异 - python

标签 python numpy

我在从不同文件调用变量时遇到了一个小问题。我 有两个不同的文件 train_dataset.pytest_dataset.py。我运行 来 self 的 IDE 的 train_dataset.py 文件并记下数组变量的值 array_val 如下所示。

array([[ 0.08695652,  0.66459627,  0.08695652,  0.07453416,  0.07453416,
        ... 0.15217391]])

现在我打开 test_dataset.py 并导入 import train_dataset 并打印 通过调用train_dataset.array_val来获取array_val的值,我看到一个非常 不同的输出。输出如下。

    array([[  8.11594203e-01,   1.15942029e-01,   4.05797101e-01,
            ... 1.30434783e-01,   5.65217391e-01,   2.02898551e-01]])

请建议我如何消除它并说明差异的原因。

请找到我嵌入在 train_dataset.py 中的代码

no_of_clusters=9
cluster_centroids=[]
k_means=KMeans(n_clusters=no_of_clusters,n_init=14, max_iter=400)

k_means.fit(matrix_for_cluster)

labels=k_means.labels_
array_val=k_means.cluster_centers_

matrix_for_cluster是一个numpy n维数组。

在我的test_dataset.py中我所做的就是

import train_dataset
print train_dataset.array_val

最佳答案

这可能是由于 k-means 算法的随机初始化造成的

正如 @ali_m 在评论中很好地解释的那样,import train_dataset 行重新运行聚类,并且聚类中心实际上并未从您上次运行代码时保存。为此,您可以使用序列化数据

关于python - 从不同文件调用变量时数组值存在差异 - python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29748121/

相关文章:

python - 为什么 GridSearchCV 方法的精度低于标准方法?

python - cqlengine multilpe 键空间

python - 如何从链接/距离矩阵计算集群分配

python-3.x - Skimage Python33 Canny

python - 如何返回至少 4D : efficient method to simulate numpy. atleast_4d 的数组

python - 我应该在尝试/异常(exception)之后使用finally吗?

python - 替换列表中重复的相同元素

python - 谷歌大查询,403错误无法通过API查询数据

Python - 无法检测面部和眼睛?

python - 与 astype(int) 相比,numpy around/rint 慢