我们在树莓派上遇到了这个奇怪的问题。
我们在套接字上运行一项服务,该服务应该可以通过 wifi 为本地和远程客户端工作。 问题在于停止远程网络也会停止来自本地客户端的连接。
我们的 python 服务器设置一个这样的套接字:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
s.setsockopt(socket.SOL_SOCKET, socket.SO_DONTROUTE, 1)
s.settimeout(2)
s.bind(("", 8888))
while True:
try:
conn, addr = s.accept()
except socket.timeout:
print("Socket timeout on s.accept(), continuing")
continue
#do stuff
我们有一个本地 Node 客户端每秒左右运行一个这样的循环(并实际发送数据):
// every second
socket.connect("localhost", "8888" );
socket.on('connect', function() { /* do stuff */ });
socket.on('error', function(ex) { });
一切都运行良好,直到我们切断 wifi。 我们的服务器端在 s.accept 上超时,我们在日志中看到错误消息。
我认为套接字一定会监听 0.0.0.0,但不知何故不会故障转移到 127.0.0.1 或者发生某种奇怪的路由情况。
netstat -an | grep 8888
给出
tcp 0 0 0.0.0.0:8888 0.0.0.0:* LISTEN
tcp 0 0 127.0.0.1:8888 127.0.0.1:52794 TIME_WAIT
tcp 0 0 127.0.0.1:8888 127.0.0.1:52724 TIME_WAIT
tcp 0 0 127.0.0.1:8888 127.0.0.1:52740 TIME_WAIT
tcp 0 0 127.0.0.1:8888 127.0.0.1:52778 TIME_WAIT
netstart -rn
给出
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
default 192.168.1.1 0.0.0.0 UG 304 0 0 wlan0
192.168.1.0 0.0.0.0 255.255.255.0 U 304 0 0 wlan0
我猜我们只需要一条本地主机路由?
当 WiFi 恢复时,本地连接将再次建立。所以我不认为 python 套接字中的绑定(bind)会永久删除。
/etc/nsswitch.conf
中的主机行给出
hosts: files mdns4_minimal [NOTFOUND=return] dns
我们在测试期间监控了对本地主机的 ping 操作,并且它继续正常运行。 我们还监视 netstat 以查看端口在 0.0.0.0 上保持监听状态也许这就是问题所在?
最佳答案
最简单的解决方案
看来您应该避免使用“127.0.0.1”进行任何命名,如我们的评论讨论中所述。
更详细:
根据消息来源和 docs (在 nodejs first tests for an ip 之后,)它检查您是否提供了查找函数作为连接选项,如果没有,它会执行自己的 "dns.lookup"调用作为默认值。尽管有这个名称,该函数实际上尝试使用系统命名,但可能略有不同,例如它可能尝试更喜欢 ipv6。
要进一步调试,您可以尝试使用 dns.lookup 制作更直接的测试用例,并将 getent ahosts|ahostsv4|ahostsv6 localhost
的输出与您的不同系统以及 wifi 时的情况进行比较下来,以及比较其他配置,例如 gai.conf,以尝试确定该系统上的系统命名是否有点不同,或者是否给出了稍微不同的请求。
关于node.js - wifi 掉线时本地套接字绑定(bind)失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58009011/