javascript - 如何按 codePoint 对 JavaScript 字符串进行排序?

标签 javascript sorting unicode

我希望通过包含 unicode 字符的字符串字段对对象进行排序。但是,我想按代码点对字符串进行排序,而不是按区域设置。因此,这是一个示例,其中 JavaScript 对对象进行排序,以便 \u24B7b都被认为是同一个字符。

排序顺序不正确:

> [{name: 'a'}, {name: 'b'}, {name: 'd'}, {name: '\u24B7'}].sort((a,b)=> a.name.localeCompare(b.name))
[ { name: 'a' }, { name: 'b' }, { name: 'Ⓑ' }, { name: 'd' } ]

然而,这不是我想要的。我想要以下排序顺序,它们被认为是不同的字符。这是比较字符串且不包括比较器函数时的默认行为。

正确的排序顺序(注意 b\u24B7 不再被视为相同的排序字符):
> ['a','b','\u24B7','d'].sort()
[ 'a', 'b', 'd', 'Ⓑ' ]

在实际应用中,字符串将不止一个字符,并且可能包含多个 unicode 字符,我们希望它们根据 unicode 编号(即代码点)进行排序。

我的问题:有没有一种简单的方法来按字符串的代码点排序?我宁愿不为此重新实现自定义比较器。

最佳答案

我通常这样做:

let cmp = (a, b) => a > b ? 1 : a < b ? -1 : 0;

objects.sort((a, b) => cmp(a.name, b.name));

更确切地说
let sortBy = (a, f) => a.sort((x, y) => cmp(f(x), f(y)));

sortBy(objects, x => x.name);

关于javascript - 如何按 codePoint 对 JavaScript 字符串进行排序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42699973/

相关文章:

java - 使用 Java 8 比较器对具有两个值的嵌套对象进行排序

java - Java组合框填充Vector时如何排序?

Javascript 排序与 .sort()

c - 在C中读取和写入unicode字符到文件

python - Djangosyncdb 对 unicode 字符串的行为异常

javascript - 获取隐藏的 igGrid 列的单元格值

php - 当我在 JavaScript 中告诉它时,While 循环不会结束

Javascript 在文本区域中设置 unicode

javascript - 提取元素的 HTML

javascript - Jquery 函数奇怪的行为