Problem mit torque

bsd4me

Well-Known Member
Hallo,

ich versuche gerade torque ans laufen zu bekommen. Wenn man einen job mit qsub abschickt, geht das auch gut. Mit dem Biologen-Tool "REPET" (https://urgi.versailles.inra.fr/Tools/REPET) bekommt der pbs_mom folgenden Fehler:

05/19/2016 15:43:51;0002; pbs_mom;Svr;pbs_mom;Torque Mom Version = 2.5.13, loglevel = 0
05/19/2016 15:43:51;0080; pbs_mom;n/a;add_static;config[1] add name localhost value
05/19/2016 15:43:51;0002; pbs_mom;Svr;setpbsserver;localhost
05/19/2016 15:43:51;0002; pbs_mom;Svr;mom_server_add;server localhost added
05/19/2016 15:43:51;0002; pbs_mom;n/a;initialize;independent
05/19/2016 15:43:51;0001; pbs_mom;Svr;pbs_mom;LOG_ERROR::Inappropriate ioctl for device (25) in dep_initialize, kvm_open
05/19/2016 15:43:51;0002; pbs_mom;n/a;mom_open_poll;entered
05/19/2016 15:43:51;0001; pbs_mom;Svr;pbs_mom;LOG_ERROR::No such file or directory (2) in mom_open_poll, kvm_open
05/19/2016 15:43:51;0001; pbs_mom;Svr;pbs_mom;LOG_ERROR:: System error: (15012) in pbs_mom, pre_poll failed


hat jemand eine Idee, woran das genau liegen könnte?? Im Source der torque Software kommt der Fehler von folgender Stelle:

void
dep_initialize(void)
{
char *id = "dep_initialize";
int mib[2];
size_t len;
if (kd == NULL)
{

kd = kvm_open(NULL, NULL, NULL, O_RDONLY, "resmom");
if (kd == NULL)
{
log_err(errno, id, "kvm_open");
return;
}

}
...


Ach, das ganze läuft in einer jail...

Vielen Dank! Norbert
 
kvm_open() ist Teil von libkvm bietet direkten lesenden Zugriff auf Teile des Kernel-Speichers. Damit können Anwendungen Daten aus dem Kernel lesen und verwerten, zum Beispiel Angaben über den eigenen Prozess, die Prozessliste, Routingtabellen und so weiter. Das ist natürlich ein mögliches Sicherheitsleck, weshalb Zugriff auf das zum Auslesen der Daten notwendige /dev/kmem recht eingeschränkt ist. Lange Rede, kurzer Sinn: Hat das Jail ein /dev/kmem und darv der Prozess darauf zugreifen?
 
super danke... das kann es natürlich sein, also meine jail hat kein /dev/kmem... Welchen Paramter muss ich denn in der jail.conf dafür setzen?
 
Die korrekte Lösung ist, einen neuen devfs-Regelsatz anzulegen, der nur /dev/kmem im Jail freischaltet. Aber für den Anfang reicht es aus ein unbeschränktes devfs in das Jail zu mounten:
Code:
devfs_ruleset=0;
In die Konfiguration des Jails in der jail.conf.
 
so, habe ich gemacht - allerdinge mit einem neuen regelsatz nummer 8 :) sehe keinen Fehler mehr...

trotzdem läuft der pbs_mom einfach nicht...

[root@repet:mom_logs] # service pbs_mom start
Starting pbs_mom.
[root@repet:mom_logs] # service pbs_mom status
pbs_mom is not running.


in /var/spool/torque/mom_logs/20160520 steht:

05/20/2016 09:02:52;0002; pbs_mom;Svr;Log;Log opened
05/20/2016 09:02:52;0002; pbs_mom;Svr;pbs_mom;Torque Mom Version = 2.5.13, loglevel = 0
05/20/2016 09:02:52;0080; pbs_mom;n/a;add_static;config[1] add name localhost value
05/20/2016 09:02:52;0002; pbs_mom;Svr;setpbsserver;localhost
05/20/2016 09:02:52;0002; pbs_mom;Svr;mom_server_add;server localhost added
05/20/2016 09:02:52;0002; pbs_mom;n/a;initialize;independent
05/20/2016 09:02:52;0002; pbs_mom;n/a;mom_open_poll;entered
05/20/2016 09:02:52;0080; pbs_mom;Svr;pbs_mom;before init_abort_jobs


Grüße, Norbert
 
noch eine info:

[root@repet:/] # /usr/local/sbin/pbs_mom -D
resmom: kvm_nlist: No such file or directory
resmom: kvm_nlist: No such file or directory
resmom: kvm_nlist: No such file or directory
resmom: kvm_nlist: No such file or directory
resmom: kvm_nlist: No such file or directory
resmom: kvm_nlist: No such file or directory
resmom: kvm_nlist: No such file or directory
resmom: kvm_nlist: No such file or directory
mom_get_sample: entered
pbs_mom:mom_main.c:mlockall(): Operation not permitted


siehe auch:
https://lists.freebsd.org/pipermail/freebsd-stable/2008-April/042184.html
 
Zurück
Oben