]> git-server-git.apps.pok.os.sepia.ceph.com Git - ceph.git/commit
osd: heartbeat with packets large enough to require working jumbo frames. 15535/head
authorGreg Farnum <gfarnum@redhat.com>
Mon, 5 Jun 2017 20:33:14 +0000 (13:33 -0700)
committerGreg Farnum <gfarnum@redhat.com>
Tue, 13 Jun 2017 20:43:29 +0000 (13:43 -0700)
commit2096113d9e1589c571d96e34dd9cd841308a2567
tree0ac94a7f9abf57b4fbdf67dc3d9eb6f415f2c911
parentb4560572b2fbbfc5233c912d73185fc95e841cb5
osd: heartbeat with packets large enough to require working jumbo frames.

We get periodic reports that users somehow misconfigure one of their switches
so that it drops jumbo frames, yet the servers are still passing them along. In
that case, MOSDOp messages generally don't get through because they are much
larger than the 1500-byte non-jumbo limit, but the MOSDPing messages have kept
going (as they are very small and dispatched independently, even when the
server is willing to make jumbo frames). This means peer OSDs won't mark down
the ones behind the broken switch, despite all IO hanging.
Push the MOSDPing message size over the 1500-byte limit so that anybody in
this scenario will see the OSDs stuck behind a bad switch get marked down.

Fixes: http://tracker.ceph.com/issues/20087
Signed-off-by: Greg Farnum <gfarnum@redhat.com>
src/common/config_opts.h
src/messages/MOSDPing.h
src/osd/OSD.cc