java - 如何记录 nutch 插件的执行

标签 java plugins solr nutch web-crawler

我在努力打造定制nutch有特殊要求的插件。

我发现 hadoop.log 中提到了我的插件,但它不相关。

我在代码的不同地方添加了 LOG.debug("test")LOG.info("test2") 并且我在 log4j 中写了.属性

# Logging for development
log4j.logger.org.apache.nutch.parse.html=DEBUG

我的问题是:我在哪里可以找到这些消息,我检查了 hadoop.log 但我找不到任何东西?

如何记录/跟踪我的 Java 代码? (我没有使用 eclipse。)

谢谢

最佳答案

如果你的插件有类 Variable

public static final Log LOG = LogFactory.getLog(YourClass.class
        .getName());

你调用的方法有:

LOG.info("Your Logmessage");

并且您已经构建了您的插件并配置 Nutch 在获取/抓取/...时使用您的插件,然后该消息被记录在 hadoop.log 中。

当你构建 Nutch 时,它是否说它正在构建你的插件?

如果是,你可以检查你的插件配置,它被部署到 NutchHome/runtime/local/conf/nutch-site.xml:

<property>
<name>plugin.includes</name>
<value>protocol-http|urlfilter-regex|parse-(html)|yourplugin</value>
<description>The plugins which are used in every crawl ordered by call-  order</description>
</property>

如果你的插件是在运行时环境中配置的。如果不更改配置文件,则重建 Nutch。如果这没有帮助,您可以提供更多信息。

关于java - 如何记录 nutch 插件的执行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8877272/

相关文章:

javascript - 动态更改tip提示文本

android - Google Play 游戏服务 playerId 是静态的吗

c++ - 如何在 Maya API 中从 MObject 获取 Node 类实例

java - 生成方法中无法识别变量

java - android sdk无法创建项目

java - 拦截org.springframework.cache.interceptor.CacheInterceptor#invoke的spring aop

java - 以 json 格式返回 solr 响应

java - 如何使这个正则表达式成为有效的 Java 正则表达式?

SOLR:将 2 个字段复制到另一个字段中并向该新字段添加过滤器

xslt - 如何检查Solr中使用的XSLT处理器?