<div dir="ltr">Hi<div><br></div><div>Try using the None writer instead of the ASCII one.</div><div>In local.bro add :</div><div>redef Log::default_writer=Log::WRITER_NONE;<br></div><div><br></div><div>If the logger instance still crashes then the issue is not related to an IO bottleneck.</div><div><br></div><div>B</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Sep 24, 2019 at 7:49 PM Kayode Enwerem &lt;<a href="mailto:Kayode_Enwerem@ao.uscourts.gov">Kayode_Enwerem@ao.uscourts.gov</a>&gt; wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Thanks for your response.<br>
<br>
I do see the following OOM message in my system logs on the logger process ID:<br>
Sep 23 18:48:00 kernel: Out of memory: Kill process 10439 (bro) score 787 or sacrifice child<br>
Sep 23 18:48:00 kernel: Killed process 10439 (bro), UID 0, total-vm:301983900kB, anon-rss:195261772kB, file-rss:2592kB, shmem-rss:0kB<br>
<br>
Wonder why its taking so much memory, I have 251G and 99G swap on this server.<br>
total        used        free      shared  buff/cache   available<br>
Mem:           251G         66G        185G        4.2M        488M        184G<br>
Swap:           99G        1.1G         98G<br>
<br>
Below is the output of &quot;broctl diag logger&quot;, ran after the logger crashed. <br>
<br>
 [logger]<br>
<br>
No core file found.<br>
<br>
Bro 2.6.3<br>
Linux 3.10.0-1062.1.1.el7.x86_64<br>
<br>
Bro plugins:<br>
Bro::AF_Packet - Packet acquisition via AF_Packet (dynamic, version 1.4)<br>
<br>
==== No reporter.log<br>
<br>
==== stderr.log<br>
/usr/local/bro/share/broctl/scripts/run-bro: line 110: 10439 Killed                  nohup &quot;$mybro&quot; &quot;$@&quot;<br>
<br>
==== stdout.log<br>
max memory size         (kbytes, -m) unlimited<br>
data seg size           (kbytes, -d) unlimited<br>
virtual memory          (kbytes, -v) unlimited<br>
core file size          (blocks, -c) unlimited<br>
<br>
==== .cmdline<br>
-U .status -p broctl -p broctl-live -p local -p logger local.bro broctl base/frameworks/cluster broctl/auto<br>
<br>
==== .env_vars<br>
PATH=/usr/local/bro/bin:/usr/local/bro/share/broctl/scripts:/sbin:/bin:/usr/sbin:/usr/bin:/usr/local/bro/bin<br>
BROPATH=/logs/bro/spool/installed-scripts-do-not-touch/site::/logs/bro/spool/installed-scripts-do-not-touch/auto:/usr/local/bro/share/bro:/usr/local/bro/share/bro/policy:/usr/local/bro/share/bro/site<br>
CLUSTER_NODE=logger<br>
<br>
==== .status<br>
RUNNING [net_run]<br>
<br>
==== No prof.log<br>
<br>
==== No packet_filter.log<br>
<br>
==== No loaded_scripts.log<br>
<br>
Thoughts? Any suggestions.<br>
<br>
-----Original Message-----<br>
From: Vlad Grigorescu &lt;<a href="mailto:vlad@es.net" target="_blank">vlad@es.net</a>&gt; <br>
Sent: Monday, September 23, 2019 10:20 AM<br>
To: Kayode Enwerem &lt;<a href="mailto:Kayode_Enwerem@ao.uscourts.gov" target="_blank">Kayode_Enwerem@ao.uscourts.gov</a>&gt;<br>
Cc: william de ping &lt;<a href="mailto:bill.de.ping@gmail.com" target="_blank">bill.de.ping@gmail.com</a>&gt;; <a href="mailto:zeek@zeek.org" target="_blank">zeek@zeek.org</a><br>
Subject: Re: [Zeek] Why does my logger keep crashing - bro version 2.6.3<br>
<br>
The logger is threaded, so seeing CPU &gt; 100% is not necessarily a problem.<br>
<br>
Have you tried running &quot;broctl diag logger&quot; to see why the logger is crashing? Do you have any messages in your system logs about processing being killed for out of memory (OOM)?<br>
<br>
  --Vlad<br>
<br>
On Mon, Sep 23, 2019 at 1:32 PM Kayode Enwerem &lt;<a href="mailto:Kayode_Enwerem@ao.uscourts.gov" target="_blank">Kayode_Enwerem@ao.uscourts.gov</a>&gt; wrote:<br>
&gt;<br>
&gt; Thanks for your response. The CPU usage for the logger is at 311%. (look below).<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; broctl top<br>
&gt;<br>
&gt; Name         Type    Host             Pid     VSize  Rss  Cpu   Cmd<br>
&gt;<br>
&gt; logger       logger  localhost        22867    12G     9G 311%  bro<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; I wasn’t aware that you could set up multiple loggers, I tried checking the docs to see if that was an option. Does anyone know how to do this?<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; From: william de ping &lt;<a href="mailto:bill.de.ping@gmail.com" target="_blank">bill.de.ping@gmail.com</a>&gt;<br>
&gt; Sent: Sunday, September 22, 2019 6:42 AM<br>
&gt; To: Kayode Enwerem &lt;<a href="mailto:Kayode_Enwerem@ao.uscourts.gov" target="_blank">Kayode_Enwerem@ao.uscourts.gov</a>&gt;<br>
&gt; Cc: <a href="mailto:zeek@zeek.org" target="_blank">zeek@zeek.org</a><br>
&gt; Subject: Re: [Zeek] Why does my logger keep crashing - bro version <br>
&gt; 2.6.3<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Hi,<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; I would try to monitor the cpu \ mem usage of the logger instance.<br>
&gt;<br>
&gt; Try running broctl top, my guess is that you will see that the logger process will have a very high cpu usage.<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; I know of an option to have multiple loggers but I am not sure how to set it up.<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Are you writing to a file ?<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; B<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; On Thu, Sep 19, 2019 at 7:14 PM Kayode Enwerem &lt;<a href="mailto:Kayode_Enwerem@ao.uscourts.gov" target="_blank">Kayode_Enwerem@ao.uscourts.gov</a>&gt; wrote:<br>
&gt;<br>
&gt; Hello,<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Why does my logger keep crashing? Can someone please help me with this. I have provided some system information below:<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; I am running bro version 2.6.3<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Output of broctl status. The logger is crashed but the manager, proxy and workers are still running.<br>
&gt;<br>
&gt; broctl status<br>
&gt;<br>
&gt; Name         Type    Host             Status    Pid    Started<br>
&gt;<br>
&gt; logger       logger  localhost        crashed<br>
&gt;<br>
&gt; manager      manager localhost        running   17356  09 Sep 15:42:24<br>
&gt;<br>
&gt; proxy-1      proxy   localhost        running   17401  09 Sep 15:42:25<br>
&gt;<br>
&gt; worker-1-1   worker  localhost        running   17573  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-2   worker  localhost        running   17569  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-3   worker  localhost        running   17572  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-4   worker  localhost        running   17587  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-5   worker  localhost        running   17619  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-6   worker  localhost        running   17614  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-7   worker  localhost        running   17625  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-8   worker  localhost        running   17646  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-9   worker  localhost        running   17671  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-10  worker  localhost        running   17663  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-11  worker  localhost        running   17679  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-12  worker  localhost        running   17685  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-13  worker  localhost        running   17698  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-14  worker  localhost        running   17703  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-15  worker  localhost        running   17710  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-16  worker  localhost        running   17717  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-17  worker  localhost        running   17720  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-18  worker  localhost        running   17727  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-19  worker  localhost        running   17728  09 Sep 15:42:27<br>
&gt;<br>
&gt; worker-1-20  worker  localhost        running   17731  09 Sep 15:42:27<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Here’s my node.cfg settings<br>
&gt;<br>
&gt; [logger]<br>
&gt;<br>
&gt; type=logger<br>
&gt;<br>
&gt; host=localhost<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; [manager]<br>
&gt;<br>
&gt; type=manager<br>
&gt;<br>
&gt; host=localhost<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; [proxy-1]<br>
&gt;<br>
&gt; type=proxy<br>
&gt;<br>
&gt; host=localhost<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; [worker-1]<br>
&gt;<br>
&gt; type=worker<br>
&gt;<br>
&gt; host=localhost<br>
&gt;<br>
&gt; interface=af_packet::ens2f0<br>
&gt;<br>
&gt; lb_method=custom<br>
&gt;<br>
&gt; #lb_method=pf_ring<br>
&gt;<br>
&gt; lb_procs=20<br>
&gt;<br>
&gt; pin_cpus=6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25<br>
&gt;<br>
&gt; af_packet_fanout_id=25<br>
&gt;<br>
&gt; af_packet_fanout_mode=AF_Packet::FANOUT_HASH<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Heres more information on my CPU. 32 CPUs, model name – AMD, CPU max <br>
&gt; MHz is 2800.0000<br>
&gt;<br>
&gt; Architecture:          x86_64<br>
&gt;<br>
&gt; CPU op-mode(s):        32-bit, 64-bit<br>
&gt;<br>
&gt; Byte Order:            Little Endian<br>
&gt;<br>
&gt; CPU(s):                32<br>
&gt;<br>
&gt; On-line CPU(s) list:   0-31<br>
&gt;<br>
&gt; Thread(s) per core:    2<br>
&gt;<br>
&gt; Core(s) per socket:    8<br>
&gt;<br>
&gt; Socket(s):             2<br>
&gt;<br>
&gt; NUMA node(s):          4<br>
&gt;<br>
&gt; Vendor ID:             AuthenticAMD<br>
&gt;<br>
&gt; CPU family:            21<br>
&gt;<br>
&gt; Model:                 2<br>
&gt;<br>
&gt; Model name:            AMD Opteron(tm) Processor 6386 SE<br>
&gt;<br>
&gt; Stepping:              0<br>
&gt;<br>
&gt; CPU MHz:               1960.000<br>
&gt;<br>
&gt; CPU max MHz:           2800.0000<br>
&gt;<br>
&gt; CPU min MHz:           1400.0000<br>
&gt;<br>
&gt; BogoMIPS:              5585.93<br>
&gt;<br>
&gt; Virtualization:        AMD-V<br>
&gt;<br>
&gt; L1d cache:             16K<br>
&gt;<br>
&gt; L1i cache:             64K<br>
&gt;<br>
&gt; L2 cache:              2048K<br>
&gt;<br>
&gt; L3 cache:              6144K<br>
&gt;<br>
&gt; NUMA node0 CPU(s):     0,2,4,6,8,10,12,14<br>
&gt;<br>
&gt; NUMA node1 CPU(s):     16,18,20,22,24,26,28,30<br>
&gt;<br>
&gt; NUMA node2 CPU(s):     1,3,5,7,9,11,13,15<br>
&gt;<br>
&gt; NUMA node3 CPU(s):     17,19,21,23,25,27,29,31<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Would also like to know how I can reduce my packet loss. Below is the <br>
&gt; output of broctl netstats<br>
&gt;<br>
&gt; broctl netstats<br>
&gt;<br>
&gt; worker-1-1: 1568908277.861813 recvd=12248845422 dropped=5171188999 <br>
&gt; link=17420313882<br>
&gt;<br>
&gt; worker-1-2: 1568908298.313954 recvd=8636707266 dropped=971489 <br>
&gt; link=8637678939<br>
&gt;<br>
&gt; worker-1-3: 1568908278.425888 recvd=11684808853 dropped=5617381647 <br>
&gt; link=17302473791<br>
&gt;<br>
&gt; worker-1-4: 1568908285.731130 recvd=12567242226 dropped=4339688288 <br>
&gt; link=16907212802<br>
&gt;<br>
&gt; worker-1-5: 1568908298.363911 recvd=8620499351 dropped=24595149 <br>
&gt; link=8645095758<br>
&gt;<br>
&gt; worker-1-6: 1568908298.372892 recvd=8710565757 dropped=1731022 <br>
&gt; link=8712297432<br>
&gt;<br>
&gt; worker-1-7: 1568908298.266010 recvd=9065207444 dropped=53523232 <br>
&gt; link=9118737229<br>
&gt;<br>
&gt; worker-1-8: 1568908286.935607 recvd=11377790124 dropped=3680887247 <br>
&gt; link=15058934491<br>
&gt;<br>
&gt; worker-1-9: 1568908298.419657 recvd=8931903322 dropped=39696184 <br>
&gt; link=8971604219<br>
&gt;<br>
&gt; worker-1-10: 1568908298.478576 recvd=8842874030 dropped=2501252 <br>
&gt; link=8845376352<br>
&gt;<br>
&gt; worker-1-11: 1568908298.506649 recvd=8692769329 dropped=2253413 <br>
&gt; link=8695025626<br>
&gt;<br>
&gt; worker-1-12: 1568908298.520830 recvd=8749977028 dropped=2314733 <br>
&gt; link=8752293714<br>
&gt;<br>
&gt; worker-1-13: 1568908298.544573 recvd=9101243757 dropped=1779460 <br>
&gt; link=9103025399<br>
&gt;<br>
&gt; worker-1-14: 1568908291.370011 recvd=10876925726 dropped=775722632 <br>
&gt; link=11652810353<br>
&gt;<br>
&gt; worker-1-15: 1568908298.579721 recvd=8503097394 dropped=1420699 <br>
&gt; link=8504520066<br>
&gt;<br>
&gt; worker-1-16: 1568908298.594942 recvd=8515164266 dropped=1840977 <br>
&gt; link=8517006779<br>
&gt;<br>
&gt; worker-1-17: 1568908298.646966 recvd=10666567717 dropped=466489754 <br>
&gt; link=11133059283<br>
&gt;<br>
&gt; worker-1-18: 1568908298.671246 recvd=9023603573 dropped=2037607 <br>
&gt; link=9025642263<br>
&gt;<br>
&gt; worker-1-19: 1568908298.704675 recvd=8907784186 dropped=1164594 <br>
&gt; link=8908950238<br>
&gt;<br>
&gt; worker-1-20: 1568908298.718084 recvd=9140525444 dropped=2028593 <br>
&gt; link=9142555259<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Thanks,<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Zeek mailing list<br>
&gt; <a href="mailto:zeek@zeek.org" target="_blank">zeek@zeek.org</a><br>
&gt; <a href="http://mailman.ICSI.Berkeley.EDU/mailman/listinfo/zeek" rel="noreferrer" target="_blank">http://mailman.ICSI.Berkeley.EDU/mailman/listinfo/zeek</a><br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Zeek mailing list<br>
&gt; <a href="mailto:zeek@zeek.org" target="_blank">zeek@zeek.org</a><br>
&gt; <a href="http://mailman.ICSI.Berkeley.EDU/mailman/listinfo/zeek" rel="noreferrer" target="_blank">http://mailman.ICSI.Berkeley.EDU/mailman/listinfo/zeek</a><br>
</blockquote></div>