android - 从网页获取文本到字符串

标签 android string text webpage

我是 Android 新手,我想将网页中的整个文本转换为字符串。我发现了很多这样的问题,但正如我所说,我是 Android 的新手,我不知道如何在我的应用程序中使用它们。我收到错误。只有一种方法我设法让它工作,它使用 WebView 和 JavaScript,而且速度非常慢。有人可以告诉我其他方法来执行此操作或如何加快 WebView 的速度,因为我根本不使用它来查看内容。 顺便说一句,我添加了以下代码来加速 WebView

webView.getSettings().setJavaScriptEnabled(true); 
    webView.getSettings().setBlockNetworkImage(true);
    webView.getSettings().setJavaScriptCanOpenWindowsAutomatically(false);
    webView.getSettings().setPluginsEnabled(false);
    webView.getSettings().setSupportMultipleWindows(false);
    webView.getSettings().setSupportZoom(false);
    webView.getSettings().setSavePassword(false);
    webView.setVerticalScrollBarEnabled(false);
    webView.setHorizontalScrollBarEnabled(false);
    webView.getSettings().setAppCacheEnabled(false);
    webView.getSettings().setCacheMode(WebSettings.LOAD_NO_CACHE);

如果您知道其他比使用 WebView 更好更快的解决方案,请给我主要 Activity 的完整源代码,或者解释我应该在哪里编写它,这样我就不会出错。

最佳答案

使用这个:

public class ReadWebpageAsyncTask extends Activity {
    private TextView textView;

    /** Called when the activity is first created. */
    @Override
    public void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.main);
        textView = (TextView) findViewById(R.id.TextView01);
    }

    private class DownloadWebPageTask extends AsyncTask<String, Void, String> {
        @Override
        protected String doInBackground(String... urls) {
            String response = "";
            for (String url : urls) {
                DefaultHttpClient client = new DefaultHttpClient();
                HttpGet httpGet = new HttpGet(url);
                try {
                    HttpResponse execute = client.execute(httpGet);
                    InputStream content = execute.getEntity().getContent();

                    BufferedReader buffer = new BufferedReader(
                            new InputStreamReader(content));
                    String s = "";
                    while ((s = buffer.readLine()) != null) {
                        response += s;
                    }

                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
            return response;
        }

        @Override
        protected void onPostExecute(String result) {
            textView.setText(Html.fromHtml(result));
        }
    }

    public void readWebpage(View view) {
        DownloadWebPageTask task = new DownloadWebPageTask();
        task.execute(new String[] { "http://www.google.com" });

    }
}

主.xml

<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
    android:orientation="vertical"
    android:layout_width="match_parent"
    android:layout_height="match_parent"
    >

    <Button android:layout_height="wrap_content" android:layout_width="match_parent" android:id="@+id/readWebpage" android:onClick="readWebpage" android:text="Load Webpage"></Button>
    <TextView android:id="@+id/TextView01" android:layout_width="match_parent" android:layout_height="match_parent" android:text="Example Text"></TextView>
</LinearLayout>

关于android - 从网页获取文本到字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14418021/

相关文章:

Android如何在芯片组中居中对齐芯片?

android - 如何在 android 的 Tabwidget 中删除填充或边距?

string - 查找字符串中最长的非回文子串

image - 将阿拉伯文本导出为图像

Android内核修改

android - 以编程方式允许 super 用户权限

javascript - 字符串加密 - 生成独特的模式,如 Spotify 代码

python - 仅当任何字符串的开头在某些值的数据集中出现次数不超过一次时才保留字符串行

java - 用图像替换文本 docx4j

java - Java中读取文本文件到int数组