]> git.apps.os.sepia.ceph.com Git - ceph.git/commit
msg: ceph_abort() when there are enough accepter errors in msg server 25045/head
authorroot <penglaiyxy>
Mon, 30 Jul 2018 01:29:48 +0000 (21:29 -0400)
committerKefu Chai <kchai@redhat.com>
Sat, 10 Nov 2018 22:16:49 +0000 (14:16 -0800)
commitbfe74e9a8545a852eda7aee4d41dec79e0bfa10d
treee472b256e5cd8cf5059d9984768b9c9cef517dd5
parent3b1f63653ad98126ed45b4ce6cb986de461d2d3a
msg: ceph_abort() when there are enough accepter errors in msg server

In some extrem cases(we have met one in our production cluster), when Accepter thread break out , new client can not connect to the osd. Because the former heartbeat connections are already connected, other osd can not detect failure then notify monitor to mark the failed osd down.
In the patch, we there are abnormal communication errors ,we just ceph_abort  so that osd can go down fastly and other osds can notify monitor to mark the failed osd down.
Signed-off-by: penglaiyxy@gmail.com <penglaiyxy@gmail.com>
(cherry picked from commit 00e0ab407b2e9659d9121be1217e95c8117c411e)

Conflicts:
src/common/legacy_config_opts.h
src/common/options.cc
src/msg/async/AsyncMessenger.cc: trivial resolution
src/common/legacy_config_opts.h
src/common/options.cc
src/msg/async/AsyncMessenger.cc
src/msg/simple/Accepter.cc