android - 使用 Jsoup 解析文本文件

标签 android parsing html-parsing jsoup android-file

我的 res/raw 文件夹中有一个 Continent.txt 文件。里面包含以下内容。

<div class="continents"> 
  <a href="#US">US</a> 
  <a href="#CA">Canada</a> 
  <a href="#EU">Europe</a> 
</div> 

我能够使用 jsoup 解析文本 US, Canada, Europe,但是当我将它们显示到 TextView 时,它们显示在一行中。输出看起来像这样。

美国加拿大欧洲

我希望输出是这样的。

美国

加拿大

欧洲

这是我的代码。

package com.example.readfile;


import java.io.InputStream;
import java.util.ArrayList;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import android.os.AsyncTask;
import android.os.Bundle;
import android.app.Activity;
import android.content.res.Resources;
import android.widget.TextView;

public class MainActivity extends Activity {
    TextView txtContinent;

    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);

        txtContinent = (TextView) findViewById(R.id.textView1);

        new MyTask().execute();
    }

    class MyTask extends AsyncTask<Void, Void, ArrayList<String>> {

        ArrayList<String> arr_linkText = new ArrayList<String>();

        @Override
        protected ArrayList<String> doInBackground(Void... params) {

            Document doc;

            try {
                Resources res = getResources();
                InputStream in_s = res.openRawResource(R.raw.continent);

                byte[] b = new byte[in_s.available()];
                in_s.read(b);

                doc = Jsoup.parse(new String(b));
                Element link = doc.select("a").first();
                String text = doc.body().text(); 

                arr_linkText.add(text);

            } catch (Exception e) {
                // e.printStackTrace();
                txtContinent.setText("Error: can't open file.");
            }

            return arr_linkText; // << retrun ArrayList from here
        }

        @Override
        protected void onPostExecute(ArrayList<String> result) {

            for (String temp_result : result) {

                txtContinent.append(temp_result + "\n");
            }

        }

    }

}

我不知道如何逐行读取文件,希望有人能给我解释一下。谢谢你!

最佳答案

您正在一次获取整个文档的文本。你需要按每个元素解析出来,像这样

Elements links = doc.select("a");
for (Element link : links) {
    arr_linkText.add(link.text());
}

如果不清楚,上面的代码是用来替换下面的——

Element link = doc.select("a").first();
String text = doc.body().text(); 

arr_linkText.add(text);

关于android - 使用 Jsoup 解析文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14300995/

相关文章:

android - 如何给android :startColor in gradient drawable in Android?添加主题属性

Android Studio 模拟器符号未找到 : _pwritev

php正则表达式获取href标签内的字符串

java - 使用 GSON 解析带有键和选项卡的 JSON 文件

android - Android中是否需要同步I/O操作

parsing - BigInteger.Parse() 对十六进制数给出负数

c++ - 使用 Boost::Spirit 解析具有未知键的 'key = value' 列表

parsing - 语法歧义: why?(问题是: "(a)"与 "(a-z)")

javascript - 如何在 react native 或 JS 中解码特殊字符或 HTML 实体?

html - CSS 选择器只选择第一行