R:提取关键字后的值和行(文本文件挖掘)

标签 r keyword text-mining

环境:
我有(简单的).csv 和.dat 文件,这些文件是从实验室设备和其他存储测量或计算信息的程序创建的。我已经为其他语言找到了这个,但也没有为 R 找到这个

问题:
使用 R,我试图提取值以在不打开创建的文件的情况下快速显示结果。在此我有两个典型的设置:

a) 我需要在已知关键词之后读取先验未知值
b) 我需要在已知关键词或行之后阅读行

我无法使 scan() 和 grep() 等函数工作。

c) 最后我想循环一个文件夹里的几十个文件,给我一个总结(为了使图片完整:我会管理这部分)

我将不胜感激任何形式的帮助。

最佳答案

好的,它适用于键值(虽然可能不是很好)

 variable<-scan("file.csv", what=character(),sep="")

返回所有内容的字符向量
 variable[grep("keyword", ks)+2]     # + 2 as the actual value is stored two places ahead

返回隐藏值的字符。
 as.numeric(lapply(variable, gsub, patt=",", replace="."))

完成:数据必须更改为数字和“,”和“。”需要解决的问题。

在一行中:
数据=as.numeric(lapply(ks[grep("Ks_Boden", ks)+2], gsub, patt=",", replace=".​​"))

坚持不懈是一种 Assets ;-)

剩下的还没写完,等写完再发。

关于R:提取关键字后的值和行(文本文件挖掘),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13788774/

相关文章:

r - 渲染 RMarkdown 文档时修改全局环境

c - "unix"是 C 中的受限关键字吗?

c++ - move 是 c++ 中的关键字吗?

python - 找出 10 个最常出现的形态词

python - 从列表列表中删除用户名

python - 如何从我的文本中删除动词、介词、连词等?

R:填写多列

r - 查找 beta 分布和正态分布之间的交集

r - 为什么 any() 只为数字而不是逻辑 data.frame 定义?

php - `static` 函数内部的关键字?