nlp - 如何在启用SELinux的Linux机器上安装小子注释工具

标签 nlp brat

这是一个自我解答的问题,描述了如何解决在启用SELinux的普通Linux机器上安装brat annotation tool时发生的问题,该文件用于创建带注释的语料库以供NLP使用。这基于该工具的1.3版。

documented的安装过程包括以下步骤:

  • 在(Apache)Web服务器目录中解压缩.tar.gz文件,通常是/var/www/html$HOME/public_html
  • 可能将解压缩后的目录从brat-v1.3_Crunchy_Frog重命名为简单的名称,例如brat
  • 输入目录并运行sudo ./install.sh
  • 启动Web服务器(sudo service httpd start)(如果尚未运行)

  • 问题:遵循此过程时,在浏览器中尝试使用brat的任何尝试(将其定向到http://localhost/brat/index.xhtml都会失败,并在屏幕上显示以下错误消息:
    Error: ActiongetCollectionInformation failed on error Internal Server Error
    Error: Actionwhoami failed on error Internal Server Error
    Error: ActionloadConf failed on error Internal Server Error
    

    Apache错误日志(通常在/var/log/httpd/error_log中找到)还显示错误:
    (13)Permission denied: exec of '/var/www/html/new/ajax.cgi' failed, referer: http://localhost/new/index.xhtml
    Premature end of script headers: ajax.cgi, referer: http://localhost/new/index.xhtml
    

    如何解决这个问题呢?

    最佳答案

    这是由SELinux引起的。解决此问题的一种方法是禁用SELinux,但较不那么激进的方法是根据brat的要求设置访问权限。

    问题的根源是:

  • brat将可执行脚本(CGI脚本),静态文件以及带注释的数据都保留在同一目录中,即html目录

  • 默认情况下,
  • SELinux被配置为阻止从非CGI目录执行CGI脚本。仅仅更改Apache配置对
  • 没有帮助
    还配置了
  • SELinux,以防止CGI脚本将数据写入磁盘

  • 要修改SELinux配置,您需要授予对特定文件和目录的访问权限,如下所示(在brat安装目录中执行此操作):
    $> chcon -t httpd_sys_content_t .
    $> chcon -t httpd_sys_script_exec_t *.cgi
    $> sudo chcon -R -t httpd_sys_script_rw_t work data
    

    ($>代表命令提示符。)

    第一个命令启用对当前目录的读取访问(有时可能是不必要的)。第二个命令启用所有以.cgi结尾的文件的CGI脚本执行(这是必需的)。第三个命令启用对workdata目录的写访问(也是必需的);每当您将文件或子目录添加到work或`data中时,都需要再次应用它。

    关于nlp - 如何在启用SELinux的Linux机器上安装小子注释工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14518961/

    相关文章:

    nlp - 他们有使用二元概率进行句子解析的算法吗?

    nlp - NLP中下游任务的定义

    machine-learning - 如何训练 OpenNLP 模型提取多组词

    xml - 如何将注释ann文件转换为xml?

    Java,斯坦福 NLP : Extract specific speech labels from parser

    java - 使用 shell 命令运行项目

    python - 命名实体识别黄金标准语料库的样本量

    java - 使用 BRAT 创建和训练 OpenNlp 模型?

    python - 使用 brat 注释文件计算注释者间协议(protocol)

    nlp - 如何通过brat注释工具将多个标签注释为单个单词?