我有一个这种格式的 URL:
https://clientjiberish:clientsecretjiberish@api.example.com/users?username=tralala
当我这样做时:
url = 'https://clientjiberish:clientsecretjiberish@api.example.com/users?username=tralala'
uri = URI(url)
我得到了我需要的一切。
uri.host => "api.example.com"
uri.userinfo => "clientjiberish:clientsecretjiberish"
uri.path => '/users'
uri.scheme => 'https'
当 userinfo 部分有一个正斜杠时,问题就出现了。我无权更改为 API key 提供服务的 API,因此我需要找出一种方法来提取 URI 中提到的部分。
这是一个关于您可以测试 URI 的示例:
url = 'https://clientjiberish:client/secretjiberish@api.example.com/users?username=tralala'
uri = URI(url)
错误:
URI::InvalidURIError: bad URI(is not URI?)
我发现您可以像这样创建自己的解析器:
parser = URI::Parser.new(:RESERVED => ";/?:@&=+$,\\[\\]")
uri = parser.parse(url)
但我对正则表达式的了解还不够多,无法让它发挥作用。
最佳答案
url = 'https://clientjiberish:client/secretjiberish@api.example.com/users?username=tralala'
USER_INFO_REGEX = /\Ahttp[s]+:\/\/(.*)@.*\z/i
user_info = USER_INFO_REGEX.match(url)[1]
parsed_user_info = user_info.gsub(/\//, '%2F')
url = url.gsub(Regexp.new(user_info), parsed_user_info)
uri = URI(url)
USER_INFO_REGEX
匹配 https://
和 @api.example.com...
之间的字符串。只需转义用户信息字符串并将其替换为 url。
关于ruby - 如何在 userinfo 部分解析带有正斜杠的 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39750056/