r - 是否可以将文本文件中的行转换为列以获取数据框?

标签 r text-mining

我有一个文本文件,其中包含有关书名、作者姓名和出生国家的信息,这些信息以单独的行显示,如下所示:

Oscar Wilde
De Profundis    
Ireland 
Nathaniel Hawthorn  
Birthmark   
USA 
James Joyce
Ulysses
Ireland
Walt Whitman
Leaves of Grass 
USA

有没有办法将文本转换为数据框,这三个项目显示为不同的列:

ID  Author                Book               Country
1  "Oscar Wilde"          "De Profundis"     "Ireland"
2  "Nathaniel Hawthorn"   "Birthmark"        "USA" 

最佳答案

内置函数可以处理这种数据:

data.frame(scan(text=xx, multi.line=TRUE,
  what=list(Author="", Book="", Country=""), sep="\n"))

#              Author            Book Country
#1        Oscar Wilde    De Profundis Ireland
#2 Nathaniel Hawthorn       Birthmark     USA
#3        James Joyce         Ulysses Ireland
#4       Walt Whitman Leaves of Grass     USA

关于r - 是否可以将文本文件中的行转换为列以获取数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68371066/

相关文章:

.net - 使用 .Net 进行文本挖掘、事实提取、语义分析

python - 计算从年/月开始到今天的天数

r - 如何根据 ID 号分组的时间段创建变量

java - 如何使用 Rserve 在 Java 中获取 data.frame

algorithm - 潜在语义分析概念

r - 高效的jaccard相似度DocumentTermMatrix

mysql - 无法从本地 RStudio 连接到 MySQL 数据库

r - 基于现有列创建多个新列 (dplyr)

java - 为什么 MALLET LDA 需要保持序列?

R 文本挖掘 - 如何将 R 数据框列中的文本更改为多个具有词频的列?