regex - swift 正则表达式不起作用

标签 regex swift

我正在使用以下扩展方法来获取子字符串的 NSRange 数组:

extension String {
  func nsRangesOfString(findStr:String) -> [NSRange] {
    let ranges: [NSRange]
    do {
      // Create the regular expression.
      let regex = try NSRegularExpression(pattern: findStr, options: [])

      // Use the regular expression to get an array of NSTextCheckingResult.
      // Use map to extract the range from each result.
      ranges = regex.matches(in: self, options: [], range: NSMakeRange(0, self.characters.count)).map {$0.range}
    }
    catch {
      // There was a problem creating the regular expression
      ranges = []
    }
    return ranges
  }
}

但是,我没有意识到为什么有时它不起作用。这里有两个类似的案例,一个有效,另一个无效:

那个有效:

self (字符串):

"וצפן (קרי: יִצְפֹּ֣ן) לַ֭יְשָׁרִים תּוּשִׁיָּ֑ה מָ֝גֵ֗ן לְהֹ֣לְכֵי תֹֽם׃"

查找结构:

"קרי:"

而那个没有:

self (字符串):

"לִ֭נְצֹר אָרְח֣וֹת מִשְׁפָּ֑ט וְדֶ֖רֶךְ חסידו (קרי: חֲסִידָ֣יו) יִשְׁמֹֽר׃"

查找结构:

"קרי:"

(不过,另一种稳定方法将是一个合适的答案。)

最佳答案

NSRange 范围是根据 UTF-16 代码单元指定的(这 是 NSString 内部使用的),因此长度必须是 self.utf16.count:

        ranges = regex.matches(in: self, options: [],
                               range: NSRange(location: 0, length: self.utf16.count))
            .map {$0.range}

对于您的第二个字符串,我们有

let s2 = "לִ֭נְצֹר אָרְח֣וֹת מִשְׁפָּ֑ט וְדֶ֖רֶךְ חסידו (קרי: חֲסִידָ֣יו) יִשְׁמֹֽר׃"
print(s2.characters.count) // 46
print(s2.utf16.count)      // 74

这就是为什么在您的代码中找不到该模式的原因。

Swift 4 开始,您可以为整个字符串计算一个 NSRange

NSRange(self.startIndex..., in: self)

关于regex - swift 正则表达式不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46293204/

相关文章:

swift - 从应用程序内停用 iOS 9 Safari 内容阻止?

javascript - 如何使用 JavaScript 创建用户名正则表达式?

javascript - 正则表达式中的 (?!) 运算符如何工作?

regex - 使用正则表达式从 CSV 中删除多余的引号字符

ios - "textViewDidChange"Swift 的重新声明无效

iOS swift : Send log information to iOS app from iOS framework

java - 如何使用正则表达式分割字符串文件名?

php - 用 PHP 编写一个简单的 preg_replace

ios - 在给空间时我得到 'unexpectedly found nil while unwrapping an Optional value'

swift - 快速发出 POST 请求时状态代码 400