python - 识别表中的 RA 和 Dec 重复项

标签 python pandas jupyter-notebook astropy astronomy

我正在尝试创建一个由特定区域中的对象组成的表。我正在整理 irac、2mass 和wise 数据。我已将所有数据合并到一张表中,现在正在尝试根据 RA 和 Dec 坐标消除重复项。我的最终目标是拥有一个完整的表格,没有任何重复。因此,如果一个对象位于 irac 数据中,则 2mass 或wise 数据中没有等效对象。我是使用 python 的新手。如果能获得重复项的行号那就太好了。

import pandas as pd

df = pd.read_csv('filename.csv')

duplicate = []

for num in df['ra' and 'dec']:
     if any(df['ra' and 'dec'].duplicated()):
          dublicate.append(num)

这已经运行了一段时间,我只是不确定它是否正确或有效。 ra 和 dec 值位于两个单独的列中。

最佳答案

您尝试执行的任务是天空坐标的目录交叉匹配。像 drop_duplicates 这样的 pandas 方法并不合适,因为它们使用精确的数值比较,但一般来说,目录中的 RA 和 Dec 值会因与目录精度相关的值而有所不同。

高效的目录交叉匹配本身就是一个大主题,但您可以从以下引用资料开始:

关于python - 识别表中的 RA 和 Dec 重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57208301/

相关文章:

python - 如何使用 to_clipboard() 提供 DataFrame 的可复制副本

python - Jupyter conda 异常 GET/api/kernelspecs 两个默认环境

python - Flask 下 Botox 的 Dynamodb JSON 响应错误

python - 使用 PANDAS 组合数据框并添加文件名

python - 修改pandas中的数据

python - 计算列表中具有相同值的子列表

python - 在 jupyter notebook 中运行 pytest 测试函数

python - 将装饰器类应用于类方法

python - 使用 "$gte"和 "$lte"时 Pymongo 返回错误

python - 收集所有不同轮廓的非零像素