]> git.apps.os.sepia.ceph.com Git - ceph.git/commitdiff
init: fix OSD startup issue 1562/head
authorDmitry Smirnov <onlyjob@member.fsf.org>
Sat, 29 Mar 2014 00:59:24 +0000 (11:59 +1100)
committerDmitry Smirnov <onlyjob@member.fsf.org>
Sat, 29 Mar 2014 01:06:37 +0000 (12:06 +1100)
 On machines with MON and OSDs (on boot) OSDs started shortly after MON startup
 but MON needs time to become oprational so OSDs fail to start due to short
 timeout because they don't have enough time to establish communication with
 cluster. This is even more likely to happen when there are other monitors down
 which is not unusual when servers are rebooting after power failure.
 Increasing timeout significantly improves chances for successful OSD start.

Signed-off-by: Dmitry Smirnov <onlyjob@member.fsf.org>
src/init-ceph.in

index c27ca341aeff1e6b579deb4a6b2bb7998f687e04..846bd573cef760444ea502e493780c32ed9d266c 100644 (file)
@@ -327,7 +327,7 @@ for name in $what; do
                    get_conf osd_weight "" "osd crush initial weight"
                    defaultweight="$(df -P -k $osd_data/. | tail -1 | awk '{ print sprintf("%.2f",$2/1073741824) }')"
                    get_conf osd_keyring "$osd_data/keyring" "keyring"
-                   do_cmd "timeout 10 $BINDIR/ceph -c $conf --name=osd.$id --keyring=$osd_keyring osd crush create-or-move -- $id ${osd_weight:-${defaultweight:-1}} $osd_location"
+                   do_cmd "timeout 30 $BINDIR/ceph -c $conf --name=osd.$id --keyring=$osd_keyring osd crush create-or-move -- $id ${osd_weight:-${defaultweight:-1}} $osd_location"
                fi
            fi