java - 读取在线xml文件并进行解析

标签 java xml xml-parsing youtube sax

我试图在youtube视频上获得评论,并使用sax解析它们。以下是仅打印给定URL的注释的代码。我想将其更改为将URL作为用户输入并打印注释的内容。 XML是联机的,并且不保存在本地磁盘上,我也不想使用预先保存的文件。

public class ReadXMLFile {
    public static void main(String argv[]) {
        try {
            SAXParserFactory factory = SAXParserFactory.newInstance();
            SAXParser saxParser = factory.newSAXParser();
            DefaultHandler handler = new DefaultHandler() {
                boolean content=false;
                int i=0;
                public void startElement(String uri, String localName,String qName, 
                    Attributes attributes) throws SAXException {
                    if (qName.equalsIgnoreCase("Content")) {
                        content = true;
                        i+=1;
                    }    
                }
                public void endElement(String uri, String localName,
                    String qName) throws SAXException { 

                }
                public void characters(char ch[], int start, int length) throws SAXException {
                    if (content) {
                        System.out.println("Comment " + i +": "+ new String(ch, start, length));
                        content = false;
                    }
                }
            };
            saxParser.parse("D:\\comment.xml", handler);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

最佳答案

有了它,您可以将网页的内容作为inputStream:

String urlStr = "http://www.stackoverflow.com";
URL url = new URL(urlStr);
URLConnection conn = url.openConnection ();
conn.getInputStream()

关于java - 读取在线xml文件并进行解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15278581/

相关文章:

android - 在 Eclipse 中自动生成 xml 布局的 java 代码

java - JUnit测试类顺序

java - URL 绑定(bind)到 JSP 的 Jersey 问题

xml - Magento 使用 soap v2 创建类别

javascript - 在javascript中按属性选择xml节点

java - 使用Java获取不基于命名空间的xml标签

javascript - 如何在javascript中解析带有 `find`的xml属性?

java - Hadoop 字数统计

java - 使用java在单个系统上生成100个虚拟ip

java - 使用java解析xml并保留html标签