java - 无法通过 Android/Java 提取 HTML 数据

标签 java android jquery web-scraping jsoup

我正在尝试使用 Android/Java/JSoup 从网站上抓取一些数据,但我无法使用下面显示的 url 中的表格数据更新我的 textview。

我相信关于 JSOUP 解析表数据的实现,我几乎做对了所有事情,但是由于某些奇怪的原因,当我执行以下命令时,我仍然无法查看我试图获取的数据:

来源:

package com.example.test;

import java.io.BufferedReader;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import org.apache.http.HttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.DefaultHttpClient;

import android.app.Activity;
import android.app.ProgressDialog;
import android.os.AsyncTask;
import android.os.Bundle;
import android.view.View;
import android.widget.TextView;

public class MainActivity extends Activity {

    TextView tv;
    final String URL = "http://sheriff.org/apps/arrest/results.cfm?lname=&fname=";lname=&fname=";
String tr;

    @Override
    public void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);

        tv = (TextView) findViewById(R.id.TextView01);
        new MyTask().execute(URL);
    }

    private class MyTask extends AsyncTask<String, Void, String> {
        ProgressDialog prog;
        String title = "";

        @Override
        protected void onPreExecute() {
            prog = new ProgressDialog(MainActivity.this);
            prog.setMessage("Loading....");
            prog.show();
        }

        @Override
        protected String doInBackground(String... params) {
            try {
                Document doc = Jsoup.connect(params[0]).get();
                Elements tableElement = doc.select(".datagrid");
                Element th = doc.select("tr").first();
                Element firstTh = th.select("th").first();
                title = firstTh.text();
        }   catch (IOException e) {
                e.printStackTrace();
            }
            return title;
        }

        @Override
        protected void onPostExecute(String result) {
            super.onPostExecute(result);
            prog.dismiss();
            tv.setText(result);
        }
    }
}

最佳答案

我想我可以为您做解析。至少它适用于 Java。只需将 System.out.println 部分更改为其他内容,即可在 UI 上显示数据。您可以使用 cells.get(i) 获取表格单元格的内容。

    try {
        doc = Jsoup.connect(params[0]).get();
        Element tableElement = doc.select(".datagrid").first();

        Elements tableRows = tableElement.select("tr");
        for (Element row : tableRows) {
            Elements cells = row.select("td");
            if (cells.size() >0) {
                System.out.println(cells.get(0).text()+"; "+cells.get(1).text()+"; "+cells.get(2).text()+"; "+cells.get(3).text());
            }
        }


    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

关于java - 无法通过 Android/Java 提取 HTML 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19187658/

相关文章:

java - 如何更改曾经播放的音频文件的名称?

android - roboto-android 和 roboto-unhinted 之间有什么区别?

javascript - 安卓 WebView : Handle arrow keys in JavaScript

安卓时区困惑

javascript - 如何显示 DIv AS HTML 内容中文本区域的 HTML 内容而不是文本?

内存问题

java - 在 Spring 中列出已解析的属性

javascript - 使用 jQuery inArray 并隐藏选项值

java - 按下按钮时不会重置时间

jquery - 使用样式(url)查找将 css 添加到类