r - 从字符串变量创建虚拟变量

标签 r dummy-variable

我正在尝试从现有数据集中的列变量创建虚拟变量。我感兴趣的变量是这种格式的标题:

化学品 - 2015 年 3 月 31 日的委员会授权指令 (EU) 2015/863 修订了欧洲议会和理事会指令 2011/65/EU 的附件 II 关于限用物质 list (与 EEA 相关的文本)

委员会执行指令 (EU) 2015/2392...

我想创建一个虚拟变量来指示 Title 是实现还是委托(delegate)。换句话说,当“委托(delegate)”一词出现在我的 title 变量中时,这将被标记为 1,而其他所有内容将被标记为 0。

谁能帮我解决这个问题?非常感谢。到目前为止,我使用了这段代码:

infringements$delegated <- ifelse(infringements$Title=="Delegated", 1, 0)
table(infringements$delegated, infringements$Title)  
summary(infringements$delegated)

当我运行代码时,我得到了 0 个匹配项,即使我知道有 41 个匹配项。

最佳答案

我们可以做到

+(grepl('Delegated', infringements$Title))

关于r - 从字符串变量创建虚拟变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42972636/

相关文章:

python - 重新分类 Pandas 数据框中的列

php - 在 WAMP 环境中设置 Concerto 自适应测试平台时出错

r - 根据频率绘制带有符号的地理 map

r - dummy_cols 错误 : vector memory exhausted (limit reached? )

binary-data - 这个二进制编码器的功能是如何工作的?

python - pandas - 多个 'yes/no' 虚拟变量

RGraphiz 安装继续失败 ubuntu 12.04

r - seq_along 有效但 seq 产生意外结果的例子有哪些?

r - R 中包含异常值的 map