Javascript 阅读文档和 PDF

标签 javascript jquery html

<分区>

我正在尝试从文档和 pdf 文件中提取文本并将它们放在文本区域中。

我的代码如下:

<html>
    <head>
        <title>FileReader Example</title>

        <script src="http://code.jquery.com/jquery-1.9.1.min.js"></script>
        <script src="http://code.jquery.com/mobile/1.4.2/jquery.mobile-1.4.2.min.js"></script>
        <script src="http://ajax.googleapis.com/ajax/libs/jquery/1/jquery.min.js"></script>

        <script type="text/javascript" charset="utf-8">
            function upload(){
                document.getElementById("image_src").click();
            }

            $("document").ready(function () {
                $("#image_src").change(function () {
                    readBlob();
                });
            });

            function readBlob() {
                var files = document.getElementById('image_src').files;
                if (!files.length) {
                    alert('Please select a file!');
                    return;
                }

                var file = files[0];
                var start = 0;
                var stop = file.size - 1;
                var reader = new FileReader();

                // If we use onloadend, we need to check the readyState.
                reader.onloadend = function (evt) {
                    console.log(evt.target.result);
                    console.log(evt.target.data);
                    if (evt.target.readyState == FileReader.DONE) { // DONE == 2
                        document.getElementById('byte_content').textContent = evt.target.result;
                    }
                };

                var blob = file.slice(start, stop + 1);
                reader.readAsBinaryString(blob);
            }
        </script>

        <style>
            #image_src {
                position:absolute;
                left:-9999px;
            }
            #img {
                cursor:pointer;
            }
        </style>
    </head>
    <body>
        <div class="container">
            <img id="img" src="images/ChooseFile.png" onclick="upload()" alt="hellp"/>
            <input type="file" name="image_src" id="image_src" />
            <pre id="fileDisplayArea"><pre>
            <div id="byte_content"></div>
        </div>
    </body>
</html>

我遇到的唯一问题是文本显示为垃圾,但如果我上传文本文件,它就可以正常工作。出了什么问题?

最佳答案

PDF 是一种二进制格式,它可能包含交互式元素,例如注释、表单域、视频和 Flash 动画。

如果您需要使用 PDF 文档,我建议查看 PDF.js项目。

我找到了一些可以帮助您入门的 API 文档:

关于Javascript 阅读文档和 PDF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26381780/

相关文章:

Jquery animate() 和 google chrome 问题

javascript - 放大弹出窗口 : open by clicking on something other than the image

Javascript:如何在网站上进行拖放操作时设置光标?

JavaScript 执行从函数声明开始,而不是从 $(document).ready() 开始?

javascript - 想在表单加载时使用 angular js 禁用提交按钮

JavaScript 点击事件 - 为什么我需要两个 addEventListeners?

html - 课后CSS选择器

javascript - 如何将加载到 <object> 中的元素样式设置为数据

javascript - AJAX - 另一个函数可以在成功的过程中执行吗?

html - 使用rowspan后如何显示行底边框?