]> git-server-git.apps.pok.os.sepia.ceph.com Git - ceph.git/commit
qa/cephadm: fix NFS ganesha startup failure in containers 68305/head
authorRedouane Kachach <rkachach@ibm.com>
Fri, 10 Apr 2026 09:34:12 +0000 (11:34 +0200)
committerRedouane Kachach <rkachach@ibm.com>
Fri, 10 Apr 2026 09:34:12 +0000 (11:34 +0200)
commite84f81c421ca79225c0f0b6efa9d068e841f669a
tree16e47eda637fc7f6c8f622c89e7887013abe0822
parent61f9a6a85091e824b136d0a2b2fcb50ef432d8df
qa/cephadm: fix NFS ganesha startup failure in containers

The test_cephadm.sh workunit deploys NFS using cephadm _orch deploy with
config_blobs sourced from src/cephadm/samples/nfs.json. The ganesha.conf
section in that sample has no NFS_CORE_PARAM block, so allow_set_io_flusher_fail
defaults to false.

On Rocky Linux 10 (the current base for ceph:main images), ganesha 7.0 calls
prctl(PR_SET_IO_FLUSHER) at startup. Containers lack the required capabilities
(CAP_SYS_ADMIN/CAP_SYS_RAWIO) for this syscall, so it returns EPERM. With
allow_set_io_flusher_fail unset, ganesha treats this as a fatal error and aborts
immediately, before even fetching the %url RADOS config.

The orchestrator path (ganesha.conf.j2) already has allow_set_io_flusher_fail = true
in its NFS_CORE_PARAM block. This fix brings the sample config used by the
standalone test path in line with it.

Fixes: workunits/{agent/on mon_election/connectivity
task/test_cephadm} failures

Signed-off-by: Redouane Kachach <rkachach@ibm.com>
src/cephadm/samples/nfs.json