r - 使用直方图作为 R 中的输入

标签 r input histogram

诚然,这是一个非常简单的问题,我只是找不到答案。

在 R 中,我有一个包含 2 列的文件:1 列是分类数据名称,第二列是计数列(每个类别的计数)。 对于一个小数据集,我会使用“reshape”和“untable”函数来制作 1 列并以这种方式进行分析。 问题是,如何用 处理这个问题大数据集 ?

在这种情况下,我的数据是巨大的,那是行不通的。

我的问题是,我如何告诉 R 使用以下内容作为分布数据:

Cat Count
A   5
B   7
C   1

也就是说,我给它一个直方图作为输入,并让 R 在计算有关数据的其他信息时计算出这意味着有 5 个 A、7 个 B 和 1 个 C。

所需的输入而不是输出将使 R 理解数据将与以下相同,

一种
一种
一种
一种
一种







C

在合理大小的数据中,我可以自己做,但是当数据非常大时怎么办?

编辑

所有计数的总和为 262,916,849。

就它的用途而言:

这是新数据,试图了解这些新数据与其他数据之间的相关性。需要处理线性回归和混合模型。

最佳答案

我认为您要问的是 reshape 类别的数据框并将其计数为单个观察向量,其中类别重复。这是一种方法:

dat <- data.frame(Cat=LETTERS[1:3],Count=c(5,7,1))
#  Cat Count
#1   A     5
#2   B     7
#3   C     1
rep.int(dat$Cat,times=dat$Count)
# [1] A A A A A B B B B B B B C
#Levels: A B C

关于r - 使用直方图作为 R 中的输入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12375881/

相关文章:

r - 如何在 R 的一个面板中显示多个图?

r - SVM 正在处理训练集,但不处理 R 中的测试集

html - 设置输入文本和输入提交在同一高度的问题

python - Matplotlib:如何用等面积的箱子制作直方图?

python - x Axis 上的间隔

r - 如何更改R中所有用户的文件权限

r - 查找 R 树 newick 格式的提示

jquery - 待办事项列表清理输入 jQuery

javascript - 如何使用文本框作为常量输入?

javascript - 计算直方图图形列高