Hi,<br><br>I have experienced a new lock. I have seen that 4 of the UDP worker processes, but not all, have gone 100% cpu. Kamailio was still able to process messages through the rest of UDP worker processes. By checking the logs I can see that the 4 blocked processes have stopped handling messages at the same time.<br>

<br>I have attached to the blocked processes and the backtrace looks similar to the previous one except that it seems that the lock is not exactly related to t_replicate.<br><br>#0  0xb7f24410 in ?? ()<br>#1  0xbf9cdeb8 in ?? ()<br>

#2  0x00000001 in ?? ()<br>#3  0xa72eb318 in ?? ()<br>#4  0xb7e804ac in sched_yield () from /lib/tls/i686/cmov/libc.so.6<br>#5  0xb7aee463 in lock_hash (i=13692) at ../../mem/../fastlock.h:182<br>#6  0xb7b09587 in t_lookup_request (p_msg=0x81d9708, leave_new_locked=1) at t_lookup.c:468<br>

#7  0xb7b0a4ae in t_newtran (p_msg=0x81d9708) at t_lookup.c:1124<br>#8  0xb7afc40c in t_relay_to (p_msg=0x81d9708, proxy=0x0, flags=8) at t_funcs.c:212<br>#9  0xb7b0fac7 in w_t_relay (p_msg=0x81d9708, proxy=0x0, flags=0x8 &lt;Address 0x8 out of bounds&gt;) at tm.c:1002<br>

#10 0x0805301c in do_action (a=0x818c370, msg=0x81d9708) at action.c:874<br>#11 0x080557aa in run_action_list (a=0x818c370, msg=0x81d9708) at action.c:145<br>#12 0x0809c304 in eval_expr (e=0x818c3d8, msg=0x81d9708, val=0x0) at route.c:1171<br>

#13 0x0809bd80 in eval_expr (e=0x818c400, msg=0x81d9708, val=0x0) at route.c:1488<br>#14 0x0809bd16 in eval_expr (e=0x818c428, msg=0x81d9708, val=0x0) at route.c:1493<br>#15 0x080527ed in do_action (a=0x818c740, msg=0x81d9708) at action.c:729<br>

#16 0x080557aa in run_action_list (a=0x818be08, msg=0x81d9708) at action.c:145<br>#17 0x08053efb in do_action (a=0x81a6a48, msg=0x81d9708) at action.c:120<br>#18 0x080557aa in run_action_list (a=0x81a14e0, msg=0x81d9708) at action.c:145<br>

#19 0x08053efb in do_action (a=0x81c29f0, msg=0x81d9708) at action.c:120<br>#20 0x080557aa in run_action_list (a=0x81c2698, msg=0x81d9708) at action.c:145<br>#21 0x08054491 in do_action (a=0x81c2b48, msg=0x81d9708) at action.c:746<br>

#22 0x080557aa in run_action_list (a=0x81c2030, msg=0x81d9708) at action.c:145<br>#23 0x08053efb in do_action (a=0x8193278, msg=0x81d9708) at action.c:120<br>#24 0x080557aa in run_action_list (a=0x8193278, msg=0x81d9708) at action.c:145<br>

#25 0x08054491 in do_action (a=0x8193418, msg=0x81d9708) at action.c:746<br>#26 0x080557aa in run_action_list (a=0x8193418, msg=0x81d9708) at action.c:145<br>#27 0x08054f2d in do_action (a=0x8193480, msg=0x81d9708) at action.c:752<br>

#28 0x080557aa in run_action_list (a=0x81922f0, msg=0x81d9708) at action.c:145<br>#29 0x08054491 in do_action (a=0x81934e8, msg=0x81d9708) at action.c:746<br>#30 0x080557aa in run_action_list (a=0x818ee78, msg=0x81d9708) at action.c:145<br>

#31 0x08053efb in do_action (a=0x81b3448, msg=0x81d9708) at action.c:120<br>#32 0x080557aa in run_action_list (a=0x81b0ed0, msg=0x81d9708) at action.c:145<br>#33 0x08054491 in do_action (a=0x81b5f68, msg=0x81d9708) at action.c:746<br>

#34 0x080557aa in run_action_list (a=0x81b5f68, msg=0x81d9708) at action.c:145<br>#35 0x08054f2d in do_action (a=0x81b5fd0, msg=0x81d9708) at action.c:752<br>#36 0x080557aa in run_action_list (a=0x81aefd0, msg=0x81d9708) at action.c:145<br>

#37 0x08053efb in do_action (a=0x818bc08, msg=0x81d9708) at action.c:120<br>#38 0x080557aa in run_action_list (a=0x8187910, msg=0x81d9708) at action.c:145<br>#39 0x08055b43 in run_top_route (a=0x8187910, msg=0x81d9708) at action.c:120<br>

#40 0x0808c659 in receive_msg (<br>    buf=0x8158040 &quot;INVITE <a href="mailto:sip%3Axxxxxxxx@xxxxxxx.com">sip:xxxxxxxx@xxxxxxx.com</a> SIP/2.0\r\nRecord-Route: &lt;sip:10.100.2.252;lr=on;ftag=as6897d90b&gt;\r\nVia: SIP/2.0/UDP 10.100.2.252;branch=z9hG4bKc753.2c8885d4.0\r\nVia: SIP/2.0/UDP 10.100.2.253:5060;bra&quot;..., len=896, rcv_info=0xbf9d0aa4) at receive.c:175<br>

#41 0x080c3ea3 in udp_rcv_loop () at udp_server.c:449<br>#42 0x0806e394 in main (argc=9, argv=0xbf9d0c84) at main.c:774<br><br>I hope this provides some new hints on what might be happening.<br><br>Thanks,<br><br>Santi<br>

<br><br><div class="gmail_quote">2010/5/13 Santiago Gimeno <span dir="ltr">&lt;<a href="mailto:santiago.gimeno@gmail.com">santiago.gimeno@gmail.com</a>&gt;</span><br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">

Hi,<br><br>We don&#39;t use any flags in the t_replicate function, just the uri of the backup proxy.<br>I think we are not creating any transaction before t_replicate.<div><div></div><div class="h5"><br><br>Thanks,<br><br>

Santi<br><br><div class="gmail_quote">
2010/5/13 Daniel-Constantin Mierla <span dir="ltr">&lt;<a href="mailto:miconda@gmail.com" target="_blank">miconda@gmail.com</a>&gt;</span><br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">





  

<div bgcolor="#ffffff" text="#000000">
Hello,<br>
<br>
what are the parameters for t_replicate(), any flags? Do you create a
transaction for register before t_replicate (e.g., by calling t_newtran
in config)?<br>
<br>
Cheers,<br>
Daniel<div><div></div><div><br>
<br>
<br>
On 5/13/10 11:53 AM, Santiago Gimeno wrote:
<blockquote type="cite">Hi,<br>
  <br>
It happens randomly, after some hours or some days, no particular
pattern.<br>
There is no error message in the syslog. The debug level is set at 0.
Would a higher debug level help to track the issue?<br>
We only use t_replicate to send the REGISTER to a backup proxy.<br>
  <br>
Thanks,<br>
  <br>
Santi<br>
  <br>
  <div class="gmail_quote">2010/5/13 Daniel-Constantin Mierla <span dir="ltr">&lt;<a href="mailto:miconda@gmail.com" target="_blank">miconda@gmail.com</a>&gt;</span><br>
  <blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
    <div bgcolor="#ffffff" text="#000000">Hello,<br>
    <br>
seems to be something related to t_replicate(). Can you reproduce it
easily? If not, how often does it happen? Do you see any particular
error messages in syslog, before frozen?<br>
    <br>
Cheers,<br>
Daniel
    <div>
    <div><br>
    <br>
On 5/13/10 10:39 AM, Santiago Gimeno wrote:
    </div>
    </div>
    <blockquote type="cite">
      <div>
      <div>Hi,<br>
      <br>
I&#39;m working with Kamailio 1.5 (rev 5968) and from time to time kamailio
freezes and stops processing messages. Kamailio is working only in UDP.
I really don&#39;t know in which conditions this problem is happening: it
happens both in high and low load.<br>
Here is a backtrace of one of the UDP working processes when kamailio
is frozen (all the other UDP process backtraces look similar) :<br>
      <br>
#0  0xb7fdf410 in ?? ()<br>
#1  0xbfbfec28 in ?? ()<br>
#2  0x00000001 in ?? ()<br>
#3  0xa7392ad0 in ?? ()<br>
#4  0xb7f3b4ac in sched_yield () from /lib/tls/i686/cmov/libc.so.6<br>
#5  0xb7ba9463 in lock_hash (i=10361) at ../../mem/../fastlock.h:182<br>
#6  0xb7bc4587 in t_lookup_request (p_msg=0x823fc70,
leave_new_locked=1) at t_lookup.c:468<br>
#7  0xb7bc54ae in t_newtran (p_msg=0x823fc70) at t_lookup.c:1124<br>
#8  0xb7bb740c in t_relay_to (p_msg=0x823fc70, proxy=0x0, flags=1) at
t_funcs.c:212<br>
#9  0xb7bb8f6c in t_replicate (p_msg=0x823fc70, dst=0x817cdf8, flags=1)
at t_fwd.c:763<br>
#10 0xb7bc7fce in w_t_replicate (p_msg=0x823fc70, dst=0x817cdf8
&quot;\230ê\030\b\016&quot;, flags=0x0) at tm.c:957<br>
#11 0x0805301c in do_action (a=0x818eb20, msg=0x823fc70) at action.c:874<br>
#12 0x080557aa in run_action_list (a=0x818eb20, msg=0x823fc70) at
action.c:145<br>
#13 0x08054491 in do_action (a=0x818ec78, msg=0x823fc70) at action.c:746<br>
#14 0x080557aa in run_action_list (a=0x818c940, msg=0x823fc70) at
action.c:145<br>
#15 0x08053efb in do_action (a=0x81b38e0, msg=0x823fc70) at action.c:120<br>
#16 0x080557aa in run_action_list (a=0x81b3878, msg=0x823fc70) at
action.c:145<br>
#17 0x08054491 in do_action (a=0x81b5f00, msg=0x823fc70) at action.c:746<br>
#18 0x080557aa in run_action_list (a=0x81b5f00, msg=0x823fc70) at
action.c:145<br>
#19 0x08054f2d in do_action (a=0x81b5f68, msg=0x823fc70) at action.c:752<br>
#20 0x080557aa in run_action_list (a=0x81b5f68, msg=0x823fc70) at
action.c:145<br>
#21 0x08054f2d in do_action (a=0x81b5fd0, msg=0x823fc70) at action.c:752<br>
#22 0x080557aa in run_action_list (a=0x81aefd0, msg=0x823fc70) at
action.c:145<br>
#23 0x08053efb in do_action (a=0x818bc08, msg=0x823fc70) at action.c:120<br>
#24 0x080557aa in run_action_list (a=0x8187910, msg=0x823fc70) at
action.c:145<br>
#25 0x08055b43 in run_top_route (a=0x8187910, msg=0x823fc70) at
action.c:120<br>
#26 0x0808c659 in receive_msg (<br>
    buf=0x8158040 &quot;REGISTER sip:<a href="http://xxxxxxxxxxx.com" target="_blank">xxxxxxxxxxx.com</a>
SIP/2.0\r\nFrom: &lt;<a href="mailto:sip%3Axxxxxx@xxxxxxxxxxxx.com" target="_blank">sip:xxxxxx@xxxxxxxxxxxx.com</a>&gt;;tag=as516fcce2\r\nTo:
&lt;<a href="mailto:sip%3Axxxxxxx@xxxxxxxxxxxx.com" target="_blank">sip:xxxxxxx@xxxxxxxxxxxx.com</a>&gt;\r\nCall-ID:

      <a href="mailto:01e4ea8e185c85332ea68874543c810e@xxxxxxxxxxxxxx.com" target="_blank">01e4ea8e185c85332ea68874543c810e@xxxxxxxxxxxxxx.com</a>\r\nCSeq:
383
REGISTER\r\nVia: SIP&quot;..., len=794, rcv_info=0xbfc004d4) at
receive.c:175<br>
#27 0x080c3ea3 in udp_rcv_loop () at udp_server.c:449<br>
#28 0x0806e394 in main (argc=9, argv=0xbfc006b4) at main.c:774<br>
      <br>
Any idea of what might be happening?<br>
      <br>
Best regards,<br>
      <br>
Santi<br>
      </div>
      </div>
      <pre><fieldset></fieldset>
_______________________________________________
SIP Express Router (SER) and Kamailio (OpenSER) - sr-users mailing list
<div><a href="mailto:sr-users@lists.sip-router.org" target="_blank">sr-users@lists.sip-router.org</a>
<a href="http://lists.sip-router.org/cgi-bin/mailman/listinfo/sr-users" target="_blank">http://lists.sip-router.org/cgi-bin/mailman/listinfo/sr-users</a>
  </div></pre>
    </blockquote>
    <div><br>
    <pre cols="72">-- 
Daniel-Constantin Mierla
* <a href="http://www.asipto.com/" target="_blank">http://www.asipto.com/</a>
* <a href="http://twitter.com/miconda" target="_blank">http://twitter.com/miconda</a>
* <a href="http://www.linkedin.com/in/danielconstantinmierla" target="_blank">http://www.linkedin.com/in/danielconstantinmierla</a> 
    </pre>
    </div>
    </div>
  </blockquote>
  </div>
  <br>
</blockquote>
<br>
</div></div><pre cols="72">-- 
Daniel-Constantin Mierla
Kamailio Advanced Training for Carriers
June 21-23, 2010, Miami, Fl, USA
* <a href="http://www.asipto.com/" target="_blank">http://www.asipto.com/</a>
 
</pre>
</div>

</blockquote></div><br>
</div></div></blockquote></div><br>