iphone - 使用 NSXMLParser 解析 HTML,而不是 iPhone 中的完整数据

标签 iphone html ios ipad

在解析 xml 时,在某些字行结尾处未获取完整数据,并以“阅读更多”结尾

下面的三个代码位于一个 html 页面中,但为了更好地理解,我还是这么做了。

我正在使用 NSXMLParser 将其解析到我的 iPhone 应用程序中。 问题是它的解析直到 <Style>然后它停止解析文本并完全忽略文本下面的数据!!!

<head>

        <title>North Mobile County Middle School: Latest News > "1st Annual NMCK-8 Christmas Music Program"</title>
        <META HTTP-EQUIV="X-UA-COMPATIBLE" CONTENT="IE=EmulateIE9">
        <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
        <meta http-equiv="imagetoolbar" content="no">
        <script type="text/javascript" src="JavaScripts.js"></script>
        <script type="text/javascript" src="JavaScripts/NiceTitles.js"></script>


    <style type="text/css">

我正在拆分代码以便更好地理解

!--

body {
    margin:0; padding:0;
    background: #fff;}  
body, td {
    font: normal 13px "Trebuchet MS", Arial, Helvetica, sans-serif;
    color:#333;}
/***********************************************/
/* Links
/***********************************************/ 

a:link, a:visited {
    color: #CD0000;
    text-decoration: none;}
a:hover, a:active { 
    color: #06f;
    text-decoration: underline;}

img {border: 0;}

为了更好地理解,我将拆分代码

#MainPageArea {padding: 0 15px 15px 15px}
</style>
    <link href="http://images.pcmac.org/SiSFiles/Schools/AL/MobileCounty/NorthMobileMiddle/styles.css" rel="stylesheet" type="text/css">
    <!--[if lt IE 7]>
        <link href="Common/CommonIncludes/Template11/IEStyles.css" rel="stylesheet" type="text/css">
    <![endif]-->
    <link rel="Shortcut Icon" type="image/ico" href="http://images.pcmac.org/SiSFiles/Schools/AL/MobileCounty/NorthMobileMiddle/images/favicon.ico" />

</head>
<body class="DefaultPage">
    <table align="center" cellpadding="0" cellspacing="0" width="986" border="0" id="PageWrapper">
        <tr>
            <td valign="top">
                <div id="Header">

我使用的代码如下:

-(id) loadHtmlByURL:(NSString *)urlString
{

    NSURL       *url        = [NSURL URLWithString:urlString];
    NSData      *nsData     = [[NSData alloc] initWithContentsOfURL:url];

    elementArray            = [[NSMutableArray alloc] init];

    parser                  = [[NSXMLParser alloc] initWithData:nsData];
    parser.delegate         = self;
    [parser parse];

    currentHTMLElement = [HtmlElement alloc];

    return self;
}

- (void) parser:(NSXMLParser *)parser didStartElement:(NSString *)elementname namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName attributes:(NSDictionary *)attributeDict
{
    NSLog(@"%@",elementname);
    currentHTMLElement = [[HtmlElement alloc] autorelease];
}

- (void) parser:(NSXMLParser *)parser didEndElement:(NSString *)elementname namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
{
    NSLog(@"%@",elementname);
if ([elementname isEqualToString:@"head"])
    {
        currentHTMLElement.tag = elementname;
        currentHTMLElement.value = currentNodeContent;
        [elementArray addObject:currentHTMLElement];
        currentHTMLElement = nil;
        currentNodeContent = nil;
       // NSLog(@"x%@",elementArray);
    }

我能知道我被击中了吗

最佳答案

您应该只使用 NSXMLParser 类来解析实际上是 XML 的内容。 HTML 不是,除非它是 XHTML,而您的源代码不是:meta 标记不是封闭的,并且您的 style 标记以永远不会封闭的注释开头(其中我想,这就是解析器永远不会读取过去的原因);此外,title 的文本节点内容应仅包含 >" 的转义版本(转义序列为 >")。

如果您可以控制 HTML,请尝试将其更改为 XML(以及 XHTML)兼容。如果您无法更改 HTML,请尝试标签汤解析,例如使用 hpple .

关于iphone - 使用 NSXMLParser 解析 HTML,而不是 iPhone 中的完整数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14066329/

相关文章:

iOS 指南针导航

iphone - "SHK.h"找不到文件

iPhone编程: Applying Alpha to Parent but not to Child Views

iphone - 滚动 UITableView 中的一个部分

html - 如何使用 CSS 定位文本输入字段?

java - 在 Android 和 iOS 中使用的最佳服务器客户端通信协议(protocol)是什么?

iphone - 不使用drawrect方法获取UIView的Context

iphone - 根据纬度经度进行半径搜索的SQL查询

javascript - 如何在网站的所有页面中使用 NavBar 而不会弄乱链接

javascript - 关闭带箭头的页面滚动?