[Postfixbuch-users] Dovecot crashed alle paar Tage
Leo Unglaub
leo.unglaub at gmx.at
Mo Mär 9 18:05:41 CET 2009
Hallo !
> Der Grund
> waren zu viele Zugriffe auf die Datenbank, die darauf aus Performancegründen
> keine Anfragen mehr bearbeitet hat.
Das könnte den Fehler erklären, dass da irgend wo bei der Userabfrage
ein Limit oder so gesetzt ist. Auch wenn mir gerade nicht einfällt wo
das sein könnte. Aber ich werde dem nachgehen.
> Was ergibt in solchen Situationen ein
>
> lsof /var/spool/postfix/private/auth
Das gibt leider gar nix aus. Das ist komisch.
> und welchen Output ergibt zu diesem Zeitpunkt ein
>
> ps ax
Das ist folgendes:
> PID TTY STAT TIME COMMAND
> 1 ? Ss 0:02 init [2]
> 2 ? S< 0:00 [kthreadd]
> 3 ? S< 0:00 [migration/0]
> 4 ? S< 0:00 [ksoftirqd/0]
> 5 ? S< 0:00 [watchdog/0]
> 6 ? S< 0:00 [migration/1]
> 7 ? S< 0:00 [ksoftirqd/1]
> 8 ? S< 0:00 [watchdog/1]
> 9 ? S< 0:09 [events/0]
> 10 ? S< 0:06 [events/1]
> 11 ? S< 0:00 [khelper]
> 46 ? S< 0:00 [kblockd/0]
> 47 ? S< 0:00 [kblockd/1]
> 49 ? S< 0:00 [kacpid]
> 50 ? S< 0:00 [kacpi_notify]
> 128 ? S< 0:00 [ksuspend_usbd]
> 134 ? S< 0:00 [khubd]
> 137 ? S< 0:00 [kseriod]
> 185 ? S 0:00 [pdflush]
> 186 ? S 0:01 [pdflush]
> 187 ? S< 0:00 [kswapd0]
> 188 ? S< 0:00 [aio/0]
> 189 ? S< 0:00 [aio/1]
> 390 ? S< 0:00 [xfslogd/0]
> 391 ? S< 0:00 [xfslogd/1]
> 392 ? S< 0:00 [xfsdatad/0]
> 393 ? S< 0:00 [xfsdatad/1]
> 394 ? S< 0:00 [xfs_mru_cache]
> 406 ? S< 0:00 [scsi_eh_0]
> 438 ? S< 0:00 [ata/0]
> 439 ? S< 0:00 [ata/1]
> 440 ? S< 0:00 [ata_aux]
> 462 ? S< 0:00 [scsi_eh_1]
> 464 ? S< 0:00 [scsi_eh_2]
> 466 ? S< 0:00 [scsi_eh_3]
> 468 ? S< 0:00 [scsi_eh_4]
> 1095 ? S< 0:00 [kstriped]
> 1101 ? S< 0:00 [ksnapd]
> 1127 ? S< 0:01 [kjournald]
> 1208 ? S<s 0:00 udevd --daemon
> 1914 ? S< 0:00 [kjournald]
> 1915 ? S< 0:00 [kjournald]
> 1916 ? S< 0:00 [kjournald]
> 1917 ? S< 0:03 [kjournald]
> 2212 ? S< 0:01 [kondemand/0]
> 2213 ? S< 0:00 [kondemand/1]
> 2260 ? Ss 0:03 /sbin/syslogd
> 2269 ? Ss 0:00 /sbin/klogd -x
> 2278 ? Ss 0:00 /usr/sbin/acpid
> 2289 ? Ss 0:00 /usr/sbin/sshd
> 2317 ? Ss 0:03 amavisd (master)
> 2342 ? S 0:00 /bin/sh /usr/bin/mysqld_safe
> 2381 ? Sl 1:48 /usr/sbin/mysqld --basedir=/usr
> --datadir=/var/lib/mysql --user=mysql
> --pid-file=/var/run/mysqld/mysqld.pid --skip-external-locking
> --port=3306 --socket=/var/run/mysqld/mysqld.sock
> 2382 ? S 0:00 logger -p daemon.err -t mysqld_safe -i -t
> mysqld
> 2446 ? Ss 0:38 /usr/sbin/spamd --create-prefs
> --max-children 5 --helper-home-dir -d --pidfile=/var/run/spamd.pid
> 2832 ? Ss 0:24 /usr/sbin/clamd
> 2926 ? Ss 0:00 /usr/bin/freshclam -d --quiet
> 3007 ? Ss 0:06 /usr/bin/perl -w /usr/sbin/mailgraph -l
> /var/log/mail.log -d --daemon_rrd=/var/lib/mailgraph
> 3008 ? S 0:00 spamd child
> 3009 ? S 0:00 spamd child
> 3010 ? Ss 0:01 /usr/lib/postfix/master
> 3023 ? S 0:01 qmgr -l -t fifo -u
> 3050 ? Ss 0:00 /usr/sbin/cron
> 3088 tty1 Ss+ 0:00 /sbin/getty 38400 tty1
> 3090 tty2 Ss+ 0:00 /sbin/getty 38400 tty2
> 3091 tty3 Ss+ 0:00 /sbin/getty 38400 tty3
> 3092 tty4 Ss+ 0:00 /sbin/getty 38400 tty4
> 3094 tty5 Ss+ 0:00 /sbin/getty 38400 tty5
> 3096 tty6 Ss+ 0:00 /sbin/getty 38400 tty6
> 18118 ? Ss 0:01 /usr/sbin/apache2 -k start
> 21526 ? S 0:06 /usr/sbin/apache2 -k start
> 21530 ? S 0:04 /usr/sbin/apache2 -k start
> 23256 ? S 0:02 /usr/sbin/apache2 -k start
> 23329 ? S 0:02 /usr/sbin/apache2 -k start
> 23415 ? S 0:04 /usr/sbin/apache2 -k start
> 23584 ? S 0:02 /usr/sbin/apache2 -k start
> 23592 ? S 0:00 /usr/sbin/apache2 -k start
> 23600 ? S 0:00 /usr/sbin/apache2 -k start
> 23607 ? S 0:00 /usr/sbin/apache2 -k start
> 23828 ? S 0:00 /usr/sbin/apache2 -k start
> 25211 ? Ss 0:00 pure-ftpd
> (SERVER)
>
> 25896 ? S 0:03 amavisd (ch12-avail)
> 25910 ? S 0:03 amavisd (ch10-avail)
> 26473 ? S 0:00 pickup -l -t fifo -u -c
> 26619 ? Ss 0:00 sshd: masterchief [priv]
> 26625 ? S 0:00 sshd: masterchief at pts/0
> 26626 pts/0 Ss 0:00 -bash
> 26647 pts/0 S 0:00 su
> 26648 pts/0 S 0:00 bash
> 26668 pts/0 R+ 0:00 ps ax
Ich finde in der Liste aber nix von Dovecot. Der läuft nicht, daher dann
der Login-Fehler. Jetzt ist nur die Frage: Warum läuft Dovecot 2 Wochen
lang ohne warnungen und co und dann auf einmal nicht mehr. Ich finde
folgendes im LOG-File:
> dovecot: 2009-03-09 06:25:03 Warning: Killed with signal 15
> dovecot: 2009-03-09 06:25:03 Info: Dovecot v1.0.15 starting up
> dovecot: 2009-03-09 06:25:03 Warning: Killed with signal 15
> dovecot: 2009-03-09 06:25:03 Info: Dovecot v1.0.15 starting up
> dovecot: 2009-03-09 06:25:03 Error: auth(default): Socket already
> exists: /var/spool/postfix/private/auth
> dovecot: 2009-03-09 06:25:03 Error: child 25193 (auth) returned error 89
> dovecot: 2009-03-09 06:25:03 Error: Auth process died too early -
> shutting down
Mich verwirren die Zeiten. Dovecot wird mit Signal 15 gekillt und dann
sofort noch mal gekillt. Während dem Startvorgang. Das ist heavy für
Dovecot. Aber warum passiert das?
Vielen Dank
Viele Grüße
Leo
Mehr Informationen über die Mailingliste Postfixbuch-users