diacritics - USQL 急性重音

标签 diacritics u-sql bigdata

我是 U-SQL 新手。我正在尝试做一些基本查询,但发现了如何处理尖锐口音的问题。

当我的数据有尖锐的重音符号时,我会收到错误并且无法继续。我是西类牙人,所以我处理的大部分数据都有尖锐的口音。

有什么想法吗?我需要遵循一些特殊的编码协议(protocol)吗?

最佳答案

您很可能遇到编码问题。

请检查您要从中提取的文件的编码(例如,您可以使用notepad++)。

例如,如果文件采用某种 ANSI 编码,则必须先将文件转换为 UTF-8,然后再将其上传到 Data Lake。

当前支持的编码为 ASCII(不支持重音字符)、UTF-8 和 Unicode (UTF-16) LE 和 BE。我们的积压工作中支持 ANSI 代码页。如果您可以提供以下用户语音项的代码页 https://feedback.azure.com/forums/327234-data-lake/suggestions/13077555-add-ansi-code-page-support-for-built-in-extractors并投票,这将帮助我们确定待办事项功能的优先级。

关于diacritics - USQL 急性重音,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36157269/

相关文章:

mysql - Apache Spark : Is it good to use structured data

sql - SparkSQL 是 RDBMS 还是 NOSQL?

c - isLetter 在 C 中带有重音字符

javascript - 如何制作考虑重音字符的正则表达式?

escaping - 如何处理markdown中的特殊字符?

azure - U-SQL 提取语句 - 处理数百列

utf-8 - 处理后缀 sendmail 中的变音符号(非 ASCII 字符)(在控制台上发送邮件)

azure - U-SQL查询数据源

python - 使用外部 Python 包的 U-SQL

r - 如何列绑定(bind)两个ffdf