我是 U-SQL 新手。我正在尝试做一些基本查询,但发现了如何处理尖锐口音的问题。
当我的数据有尖锐的重音符号时,我会收到错误并且无法继续。我是西类牙人,所以我处理的大部分数据都有尖锐的口音。
有什么想法吗?我需要遵循一些特殊的编码协议(protocol)吗?
最佳答案
您很可能遇到编码问题。
请检查您要从中提取的文件的编码(例如,您可以使用notepad++)。
例如,如果文件采用某种 ANSI 编码,则必须先将文件转换为 UTF-8,然后再将其上传到 Data Lake。
当前支持的编码为 ASCII(不支持重音字符)、UTF-8 和 Unicode (UTF-16) LE 和 BE。我们的积压工作中支持 ANSI 代码页。如果您可以提供以下用户语音项的代码页 https://feedback.azure.com/forums/327234-data-lake/suggestions/13077555-add-ansi-code-page-support-for-built-in-extractors并投票,这将帮助我们确定待办事项功能的优先级。
关于diacritics - USQL 急性重音,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36157269/