linux - 传输端点未连接 - Mesos 从站/主站

标签 linux debian virtualbox mesos marathon

我正在尝试将 Mesos 从服务器连接到它的主服务器。每当从服务器尝试连接到主服务器时,我都会收到以下消息:

I0806 16:39:59.090845   935 hierarchical.hpp:528] Added slave 20150806-163941-1027506442-5050-921-S3 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000] (allocated: )
E0806 16:39:59.091384   940 socket.hpp:107] Shutdown failed on fd=25: Transport endpoint is not connected [107]
I0806 16:39:59.091508   940 master.cpp:3395] Registered slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000]
I0806 16:39:59.091747   940 master.cpp:1006] Slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) disconnected
I0806 16:39:59.091868   940 master.cpp:2203] Disconnecting slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092031   940 master.cpp:2222] Deactivating slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092248   939 hierarchical.hpp:621] Slave 20150806-163941-1027506442-5050-921-S3 deactivated

错误似乎是:

E0806 16:39:59.091384 940 socket.hpp:107] fd=25 时关闭失败:传输端点未连接 [107]

主机开始使用:

./mesos-master.sh --ip=10.129.62.61 --work_dir=~/Mesos/mesos-0.23.0/workdir/ --zk=zk://10.129.62.61:2181/mesos --quorum=1

还有奴隶

./mesos-slave.sh --master=zk://10.129.62.61:2181/mesos

如果我在与主机相同的虚拟机上运行从机,它工作正常。

我在互联网上找不到太多信息。我在 VirtualBox 5 上运行两个虚拟盒子 (Debian 8.1)。主机是 Windows 7。

编辑 1:

master 和 slave 都运行在一个专用的 VM 上。

两个虚拟机 nextorks 都使用桥接网络配置。

来自主人的ifconfig:

eth0      Link encap:Ethernet  HWaddr 08:00:27:cc:6c:6e
          inet addr:10.129.62.61  Bcast:10.129.255.255  Mask:255.255.0.0
          inet6 addr: fe80::a00:27ff:fecc:6c6e/64 Scope:Link
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:5335953 errors:0 dropped:0 overruns:0 frame:0
          TX packets:1422428 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:595886271 (568.2 MiB)  TX bytes:362423868 (345.6 MiB)

来自从机的 ifconfig:

eth0      Link encap:Ethernet  HWaddr 08:00:27:56:83:20
          inet addr:10.129.62.49  Bcast:10.129.255.255  Mask:255.255.0.0
          inet6 addr: fe80::a00:27ff:fe56:8320/64 Scope:Link
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:4358561 errors:0 dropped:0 overruns:0 frame:0
          TX packets:3825 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:397126834 (378.7 MiB)  TX bytes:354116 (345.8 KiB)

编辑 2:

slave 日志可以在 http://pastebin.com/CXZUBHKr 找到

可以在 http://pastebin.com/thYR1par 找到主日志

最佳答案

我遇到了类似的问题。 我的奴隶日志将充满

    E0812 15:58:04.017990  2193 socket.hpp:107] Shutdown failed on fd=13: Transport endpoint is not connected [107]

我的主人会的

    F0120 20:45:48.025610 12116 master.cpp:1083] Recovery failed: Failed to recover registrar: Failed to perform fetch within 1mins

而且 master 会死亡,并且会发生新的选举,被杀死的 master 将由 upstart(我在 Centos 6 机器上)重新启动,并被添加到潜在的 masters 池中。因此,我选出的主节点将以菊花链形式围绕我的主节点。多次重启 masters 和 slaves 什么也没做,问题总是会在 master 选举后的 1 分钟内返回。

我的解决方案来自这个 stackoverflow 问题(谢谢)和 github 中的提示 gist note .

它的要点是/etc/default/mesos-master必须指定一个quorum number(对于mesos master的数量它需要是正确的,在我的例子中是3)

    MESOS_QUORUM=2

这对我来说很奇怪,因为我在文件 /etc/mesos-master/quorum 中有相同的信息

但是我把它添加到/etc/default/mesos-master 重启了mesos-masters和slaves,问题还没有回来。

希望对你有帮助

关于linux - 传输端点未连接 - Mesos 从站/主站,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31858937/

相关文章:

android - 通过 VirtualBox Telnet 连接到 Android-x86

linux - 配置 virtualbox 虚拟机以使用主机的代理设置

linux - 无法在 shell 脚本中运行 if 条件

linux - IGMPv2泛洪源检测

python - 将参数附加到 subprocess.call()

c - 尝试 mmap 设备的 BAR-0 时出现 "Bad file descriptor"错误

php - 如何停止正在监听 http ://127. 0.0.1:8000 的 symfony 进程

linux - 列出虚拟机工作目录的脚本

sql - 用于安装 PostgreSQL 的 Bash 脚本 - 失败

linux - 将 Linux 计算机连接到 CentOS Web 服务器