我正在编写一个应用程序,您可以用它为文本拍照,然后扫描文本并将其传输到变量。我已经使用插件firebase_ml_vision完成了所有工作。
我的问题是我想自己决定从照片扫描哪个文本。例如,这可能会以一种方式工作,即每个单词和数字自动被赋予一个框架,然后用户点击被转移到变量的单词。这也适用于Google翻译(请参见屏幕截图),但不幸的是,我还没有找到任何操作方法...您知道它如何工作吗?
最佳答案
firebase-mlkit的文本识别API为frame
,cornerPoints
和VisionTextBlock
的每个返回VisionTextLine
和VisionTextElement
:
https://firebase.google.com/docs/reference/swift/firebasemlvision/api/reference/Classes/VisionTextBlock
他们应该帮助您选择单词,行或文本块。
关于flutter - 如何从扫描的照片中选择文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64197028/