java - 通过 Android 提取 HTML 数据时出现问题

标签 java android jquery html jsoup

我有一个基于 android jsoup 的应用程序,我用它从 HTML 表中提取数据,但是我无法从以下网址提取数据:

http://sheriff.org/apps/arrest/results.cfm?lname=&fname=

我只是需要一些帮助来弄清楚如何解析这个特定表中的数据。

我知道我需要在这里更改参数:

Document doc = Jsoup.connect(params[0]).get();
                Element tableHeader = doc.select("tr").first();

                for (Element element : tableHeader.children()) {
                    aa.add(element.text().toString());

这是我第一次通过 java/androind 提取 HTML 数据,我不确定具体是如何完成的。

非常感谢您的任何意见。

来源:

public class MainActivity extends Activity {
    Context context;
    ArrayList<String> aa = new ArrayList<String>();
        ListView lv;
        final String URL = "http://example.com";

        @Override
        public void onCreate(Bundle savedInstanceState) {
            super.onCreate(savedInstanceState);
            setContentView(R.layout.activity_main);
            lv= (ListView) findViewById(R.id.listView1);
            new MyTask().execute(URL);
        }

        private class MyTask extends AsyncTask<String, Void, String> {
            ProgressDialog prog;
            String title = "";

            @Override
            protected void onPreExecute() {
                prog = new ProgressDialog(MainActivity.this);
                prog.setMessage("Loading....");
                prog.show();
            }

            @Override
            protected String doInBackground(String... params) {
                try {
                    Document doc = Jsoup.connect(params[0]).get();
                    Element tableHeader = doc.select("tr").first();

                    for (Element element : tableHeader.children()) {
                        aa.add(element.text().toString());
                    }

                    title = doc.title();
                } catch (IOException e) {
                    e.printStackTrace();
                }
                return title;
            }

            @Override
            protected void onPostExecute(String result) {
                super.onPostExecute(result);
                prog.dismiss();
                ArrayAdapter<String> adapter = new ArrayAdapter<String>(MainActivity.this,android.R.layout.simple_list_item_1,aa);
                lv.setAdapter(adapter);
            }
        }
    }

HTML:

<table class="datagrid">
        <tr>
            <th>User Name</th>
            <th>Date</th>
            <th>Time</th>
            <th>Location</th>
        </tr>

            <tr>
                <td><a href="redirector.cfm?ID=c4e7a7ea-0832-4cdb-9b38-4cbdde8c07bc&page=1&&amp;lname=&amp;fname=" title="501207593">501207593&nbsp;</a></td>
                <td>LASTNAME, FIRSTNAME&nbsp;</td>
                <td>M&nbsp;</td>
                <td>Location1</td>
            </tr>

            <tr>
                <td><a href="redirector.cfm?ID=6dfb8f0b-949a-49a1-b3bf-b361544ee5d8&page=1&&amp;lname=&amp;fname=" title="501302750">501302750&nbsp;</a></td>
                <td>LASTNAME, FIRSTNAME&nbsp;</td>
                <td>M&nbsp;</td>
                <td>Location2</td>
            </tr>

            <tr>
                <td><a href="redirector.cfm?ID=b638597e-0319-4eea-a2d4-d763d43125eb&page=1&&amp;lname=&amp;fname=" title="531201804">531201804&nbsp;</a></td>
                <td>LASTNAME, FIRSTNAME&nbsp;</td>
                <td>M&nbsp;</td>
                <td>Location3</td>
            </tr>

最佳答案

或者,您可以使用 HttpURLConnection 提取链接的所有数据。

HttpURLConnection con=(HttpURLConnection)url.openConnection();

InputStream is=con.getInputStream();

FileOutputStream fos=new FileOutputStream(storeDir+"/"+filename);

int data=0;

  while((data=is.read())!=-1){

    fos.write(data);

   }

is.close();

fos.flush();

fos.close();

您可能想查看此网站以获取更多信息http://dev-androidapps.blogspot.com/2013/09/web-download.html .

关于java - 通过 Android 提取 HTML 数据时出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18907488/

相关文章:

java - 如何使用加速度计值显示数字

jquery 二级向上滑动和三级向下滑动

jQuery 表排序插件建议?

Java 泛型 - 扩展和 super 用法的特例

java - 随机生成敌人 Android

java - 响应已经提交。无法将响应发送到另一个 URL

android - 列表项从 ListView 中删除,但不从数据库中删除

Java重生过程

android - 如何从sqlite中一条一条地获取记录?

jquery - 具有水平内容 CSS 的绝对固定 div