Ë
    ¤L i<A  ã                   óü  — d dl mZmZmZmZ d dlZd dlmZ ddlmZm	Z	m
Z
mZmZmZmZmZmZmZmZmZmZmZ ddgZ G d„ de«      Zd	d
e› de› de› de› de
› dz   e_        dee   dee   dee   dee   dee   dedededededededefd„Zdee   dee   dee   dee   dee   dedededededededefd„Z ee¬«      	 	 	 	 d dee   dee   dee   dee   dee   dedee   dededededededefd„«       Zy)!é    )ÚAnyÚcastÚOptionalÚUnionN)ÚTensoré   )Ú_capturable_docÚ_default_to_fused_or_foreachÚ_differentiable_docÚ_disable_dynamo_if_unsupportedÚ_foreach_docÚ!_get_capturable_supported_devicesÚ_get_scalar_dtypeÚ_maximize_docÚ_params_docÚ
_to_scalarÚ_use_grad_for_differentiableÚ_view_as_realÚ	OptimizerÚParamsTÚAdadeltaÚadadeltac                   óÎ   ‡ — e Zd Z	 	 	 	 	 dddddœdedeeef   dedededee   d	ed
edefˆ fd„Z	ˆ fd„Z
deeef   dee   dee   dee   dee   dee   fd„Zedd„«       Zˆ xZS )r   F)Ú
capturableÚmaximizeÚdifferentiableÚparamsÚlrÚrhoÚepsÚweight_decayÚforeachr   r   r   c          	      ó@  •— t        |t        «      r|j                  «       dk7  rt        d«      ‚d|k  st        d|› «      ‚d|cxk  rdk  sn t        d|› «      ‚d|k  st        d|› «      ‚d|k  st        d|› «      ‚||||||||	d	œ}
t        ‰|   ||
«       y )
Nr   zTensor lr must be 1-elementg        zInvalid learning rate: ç      ð?zInvalid rho value: zInvalid epsilon value: zInvalid weight_decay value: )r   r   r    r!   r   r   r"   r   )Ú
isinstancer   ÚnumelÚ
ValueErrorÚsuperÚ__init__)Úselfr   r   r   r    r!   r"   r   r   r   ÚdefaultsÚ	__class__s              €úZ/mnt/ssd/data/python-lab/Trading/venv/lib/python3.12/site-packages/torch/optim/adadelta.pyr)   zAdadelta.__init__   sÈ   ø€ ô bœ&Ô! b§h¡h£j°A¢oÜÐ:Ó;Ð;ØbŠyÜÐ6°r°dÐ;Ó<Ð<ØcÔ ˜SÔ ÜÐ2°3°%Ð8Ó9Ð9ØcŠzÜÐ6°s°eÐ<Ó=Ð=ØlÒ"ÜÐ;¸L¸>ÐJÓKÐKð ØØØ(Ø Ø$ØØ,ñ	
ˆô 	‰Ñ˜ Õ*ó    c                 ó0  •— t         ‰|   |«       | j                  D ]÷  }|j                  dd «       |j                  dd«       |j                  dd«       |j                  dd«       |d   D ]¥  }| j                  j                  |g «      }t        |«      dk7  sŒ.t        j                  |d   «      rŒGt        |d   «      }|d   r*t        j                  |t        «       |j                  ¬	«      nt        j                  |t        «       ¬
«      |d<   Œ§ Œù y )Nr"   r   Fr   r   r   r   Ústep©ÚdtypeÚdevice©r2   )r(   Ú__setstate__Úparam_groupsÚ
setdefaultÚstateÚgetÚlenÚtorchÚ	is_tensorÚfloatÚtensorr   r3   )r*   r8   ÚgroupÚpÚp_stateÚstep_valr,   s         €r-   r5   zAdadelta.__setstate__A   sú   ø€ Ü‰Ñ˜UÔ#Ø×&Ñ&ò 	ˆEØ×Ñ˜Y¨Ô-Ø×Ñ˜Z¨Ô/Ø×ÑÐ-¨uÔ5Ø×Ñ˜\¨5Ô1Ø˜8‘_ò 
ØŸ*™*Ÿ.™.¨¨BÓ/Üw“< 1Ó$¬U¯_©_¸WÀV¹_Õ-MÜ$ W¨V¡_Ó5Hð
 ! Ò.ô Ÿ™Ø$Ô,=Ó,?ÈÏÉõô #Ÿ\™\¨(Ô:KÓ:MÔNð ˜F’Oñ	
ñ	r.   r?   Úparams_with_gradÚgradsÚsquare_avgsÚ
acc_deltasÚstate_stepsc                 óú  — d}|d   D ]o  }|j                   €Œ|t        j                  |«      z  }|j                  |«       |j                   j                  rt        d«      ‚|j                  |j                   «       | j                  |   }	t        |	«      dk(  r¡|d   r*t        j                  dt        «       |j                  ¬«      nt        j                  dt        «       ¬«      |	d	<   t        j                  |t        j                  ¬
«      |	d<   t        j                  |t        j                  ¬
«      |	d<   |j                  |	d   «       |j                  |	d   «       |j                  |	d	   «       Œr |S )NFr   z*Adadelta does not support sparse gradientsr   r   © r1   r4   r0   )Úmemory_formatÚ
square_avgÚ	acc_delta)Úgradr;   Ú
is_complexÚappendÚ	is_sparseÚRuntimeErrorr8   r:   Úzerosr   r3   Ú
zeros_likeÚpreserve_format)
r*   r?   rC   rD   rE   rF   rG   Úhas_complexr@   r8   s
             r-   Ú_init_groupzAdadelta._init_groupT   sS  € ð ˆàx‘ó 	.ˆAØv‰vˆ~ØØœ5×+Ñ+¨AÓ.Ñ.ˆKØ×#Ñ# AÔ&Øv‰v×ÒÜ"Ð#OÓPÐPØL‰L˜Ÿ™Ô à—J‘J˜q‘MˆEô 5‹z˜QŠð ˜\Ò*ô —K‘K Ô*;Ó*=ÀaÇhÁhÕOäŸ™ RÔ/@Ó/BÔCð f‘ô ',×&6Ñ&6Ø¤U×%:Ñ%:ô'lÑ#ô &+×%5Ñ%5Ø¤U×%:Ñ%:ô&kÑ"ð ×Ñ˜u \Ñ2Ô3Ø×Ñ˜e KÑ0Ô1Ø×Ñ˜u V™}Ö-ð9	.ð< Ðr.   c                 óx  — | j                  «        d}|$t        j                  «       5   |«       }ddd«       | j                  D ]f  }g }g }g }g }g }|d   |d   |d   |d   |d   |d   |d   |d	   f\  }	}
}}}}}}| j	                  ||||||«      }t        ||||||	|
|||||||¬
«       Œh |S # 1 sw Y   Œ€xY w)z°Perform a single optimization step.

        Args:
            closure (Callable, optional): A closure that reevaluates the model
                and returns the loss.
        Nr   r   r    r!   r"   r   r   r   )	r   r   r    r!   r"   r   r   r   rU   )Ú _cuda_graph_capture_health_checkr;   Úenable_gradr6   rV   r   )r*   ÚclosureÚlossr?   rC   rD   rE   rF   rG   r   r   r    r!   r"   r   r   r   rU   s                     r-   r0   zAdadelta.step   s3  € ð 	×-Ñ-Ô/àˆØÐÜ×"Ñ"Ó$ñ !Ù“y÷!ð ×&Ñ&ò -	ˆEØ-/ÐØ"$ˆEØ(*ˆKØ')ˆJØ(*ˆKð d‘Øe‘Øe‘ØnÑ%ØiÑ ØjÑ!ØÐ&Ñ'ØlÑ#ð	ñ	ØØØØØØØØð ×*Ñ*ØÐ'¨°¸ZÈóˆKô Ø ØØØØØØØØ)ØØ!Ø-Ø%Ø'öð=-	ð^ ˆ÷e!ð !ús   ©B0Â0B9)r$   gÍÌÌÌÌÌì?gíµ ÷Æ°>r   N©N)Ú__name__Ú
__module__Ú__qualname__r   r   r=   r   r   Úboolr)   r5   ÚdictÚstrr   ÚlistrV   r   r0   Ú__classcell__)r,   s   @r-   r   r      s  ø„ ð $'ØØØØ"&ð"+ð !ØØ$ò"+àð"+ð %˜-Ñ ð"+ð ð	"+ð
 ð"+ð ð"+ð ˜$‘ð"+ð ð"+ð ð"+ð õ"+ôHð&)àC˜H‰~ð)ð ˜v™,ð)ð F‰|ð	)ð
 ˜&‘\ð)ð ˜‘Lð)ð ˜&‘\ó)ðV "ò=ó "ô=r.   a  Implements Adadelta algorithm.

    .. math::
       \begin{aligned}
            &\rule{110mm}{0.4pt}                                                                 \\
            &\textbf{input}      : \gamma \text{ (lr)}, \: \theta_0 \text{ (params)},
                \: f(\theta) \text{ (objective)}, \: \rho \text{ (decay)},
                \: \lambda \text{ (weight decay)}                                                \\
            &\textbf{initialize} :  v_0  \leftarrow 0 \: \text{ (square avg)},
                \: u_0 \leftarrow 0 \: \text{ (accumulate variables)}                     \\[-1.ex]
            &\rule{110mm}{0.4pt}                                                                 \\
            &\textbf{for} \: t=1 \: \textbf{to} \: \ldots \: \textbf{do}                         \\
            &\hspace{5mm}g_t           \leftarrow   \nabla_{\theta} f_t (\theta_{t-1})           \\
            &\hspace{5mm}if \: \lambda \neq 0                                                    \\
            &\hspace{10mm} g_t \leftarrow g_t + \lambda  \theta_{t-1}                            \\
            &\hspace{5mm} v_t      \leftarrow v_{t-1} \rho + g^2_t (1 - \rho)                    \\
            &\hspace{5mm}\Delta x_t    \leftarrow   \frac{\sqrt{u_{t-1} +
                \epsilon }}{ \sqrt{v_t + \epsilon}  }g_t \hspace{21mm}                           \\
            &\hspace{5mm} u_t  \leftarrow   u_{t-1}  \rho +
                 \Delta x^2_t  (1 - \rho)                                                        \\
            &\hspace{5mm}\theta_t      \leftarrow   \theta_{t-1} - \gamma  \Delta x_t            \\
            &\rule{110mm}{0.4pt}                                                          \\[-1.ex]
            &\bf{return} \:  \theta_t                                                     \\[-1.ex]
            &\rule{110mm}{0.4pt}                                                          \\[-1.ex]
       \end{aligned}

    For further details regarding the algorithm we refer to `ADADELTA: An Adaptive Learning Rate Method`_.
    z
    Args:
        ar  
        lr (float, Tensor, optional): coefficient that scale delta before it is applied
            to the parameters (default: 1.0)
        rho (float, optional): coefficient used for computing a running average
            of squared gradients (default: 0.9). A higher value of `rho` will
            result in a slower average, which can be helpful for preventing
            oscillations in the learning process.
        eps (float, optional): term added to the denominator to improve
            numerical stability (default: 1e-6).
        weight_decay (float, optional): weight decay (L2 penalty) (default: 0)
        z	
        zd

    .. _ADADELTA\: An Adaptive Learning Rate Method:
        https://arxiv.org/abs/1212.5701

    r   rD   rE   rF   rG   r   r   r    r!   r   r   r   rU   c                ó  ‡— t         j                  j                  «       s7|r5t        d¬«      Št	        ˆfd„t        | |«      D «       «      sJ d‰› d«       ‚t         j                  j                  «       st        |«      }t        | ||||«      D ]{  \  }}}}}|dz  }|	s|n| }|dk7  r|j                  ||¬«      }t        j                  |«      r?t        j                  |«      }t        j                  |«      }t        j                  |«      }|j                  |«      j                  ||d|z
  ¬	«       |j                  |«      j                  «       }|j                  |«      j                  «       }|
r|j                  «       }|j!                  |«      j                  |«       |j                  |«      j                  ||d|z
  ¬	«       t        j                  |«      rt        j"                  |«      }|j%                  || ¬«       Œ~ y )
NF©Úsupports_xlac              3   ó²   •K  — | ]N  \  }}|j                   j                  |j                   j                  k(  xr |j                   j                  ‰v –— ŒP y ­wr\   ©r3   Útype©Ú.0r@   r0   Úcapturable_supported_devicess      €r-   ú	<genexpr>z*_single_tensor_adadelta.<locals>.<genexpr>
  óQ   øè ø€ ò 
ñ 4ð H‰HM‰M˜TŸ[™[×-Ñ-Ñ-ò >Ø—‘—‘Ð!=Ð=ó>ñ
ùó   ƒAAúIIf capturable=True, params and state_steps must be on supported devices: ú.r   r   ©Úalpha©Úvalue)r;   ÚcompilerÚis_compilingr   ÚallÚzipÚjitÚis_scriptingr   ÚaddrN   Úview_as_realÚmul_Úaddcmul_Úsqrt_ÚcloneÚdiv_Úview_as_complexÚadd_)r   rD   rE   rF   rG   r   r   r    r!   r   r   r   rU   ÚparamrM   rK   rL   r0   ÚstdÚdeltarm   s                       @r-   Ú_single_tensor_adadeltar‰   õ   sß  ø€ ô" >‰>×&Ñ&Ô(©ZÜ'HØô(
Ð$ô ó 
ô ˜v {Ó3ô
ô 
ð 	
ð
 XÐXtÐWuÐuvÐwó	
ð 
ô 9‰9×!Ñ!Ô#Ü˜‹^ˆä47Ø{ J°ó5ó %Ñ0ˆˆtZ ¨Dð 	‰	ˆÙ#‰t¨$¨ˆà˜1ÒØ—8‘8˜E¨8Ó6ˆDä×Ñ˜EÔ"Ü×+Ñ+¨JÓ7ˆJÜ×*Ñ*¨9Ó5ˆIÜ×%Ñ% dÓ+ˆDà‰˜Ó×%Ñ% d¨D¸¸C¹Ð%Ô@Øn‰n˜SÓ!×'Ñ'Ó)ˆØ—‘˜cÓ"×(Ñ(Ó*ˆÙØ—K‘K“MˆEØ
‰
3‹×Ñ˜TÔ"Ø‰sÓ×$Ñ$ U¨E¸¸S¹Ð$ÔAä×Ñ˜EÔ"Ü×)Ñ)¨%Ó0ˆEØ
‰
5  ˆ
Ö$ñ1%r.   c                ó„  ‡— |
rJ d«       ‚t         j                  j                  «       s7|r5t        d¬«      Št	        ˆfd„t        | |«      D «       «      sJ d‰› d«       ‚t        | «      dk(  ry t        |«      }t        j                  | ||||g«      }|j                  «       D ]™  \  \  }}}}}}t        t        t           |«      }t        t        t           |«      }t        t        t           |«      }t        t        t           |«      }t        t        t           |«      }|rt        ||||«       t         j                  j                  «       s=|d   j                  r.t        j                   |t        j"                  dd	¬
«      d¬«       nt        j                   |d«       |	rt        j$                  |«      }|dk7  r3|	rt        j                   |||¬«       nt        j&                  |||¬«      }t        j(                  ||«       t        j*                  |||d|z
  ¬«       t        j&                  ||«      }t        j,                  |«       t        j&                  ||«      }t        j,                  |«       t        j.                  ||«       t        j(                  ||«       t        j(                  ||«       t        j*                  |||d|z
  ¬«       |rIt1        |t         j                  «      r/t        j(                  || «       t        j                   ||«       Œt        j                   ||| ¬«       Œœ y )Nz#_foreach ops don't support autogradFrf   c              3   ó²   •K  — | ]N  \  }}|j                   j                  |j                   j                  k(  xr |j                   j                  ‰v –— ŒP y ­wr\   ri   rk   s      €r-   rn   z)_multi_tensor_adadelta.<locals>.<genexpr>G  ro   rp   rq   rr   r   r$   Úcpu)r3   rs   r   ru   )r;   rw   rx   r   ry   rz   r:   r   r   Ú"_group_tensors_by_device_and_dtypeÚvaluesr   rc   r   r   Úis_cpuÚ_foreach_add_r>   Ú_foreach_negÚ_foreach_addÚ_foreach_mul_Ú_foreach_addcmul_Ú_foreach_sqrt_Ú_foreach_div_r%   )r   rD   rE   rF   rG   r   r   r    r!   r   r   r   rU   Úgrouped_tensorsÚdevice_params_Údevice_grads_Údevice_square_avgs_Údevice_acc_deltas_Údevice_state_steps_Ú_Údevice_paramsÚdevice_gradsÚdevice_square_avgsÚdevice_acc_deltasÚdevice_state_stepsr‡   Údeltasrm   s                              @r-   Ú_multi_tensor_adadeltar¤   0  sð  ø€ ñ  ÐDÐDÓDÐô >‰>×&Ñ&Ô(©ZÜ'HØô(
Ð$ô ó 
ô ˜v {Ó3ô
ô 
ð 	
ð
 XÐXtÐWuÐuvÐwó	
ð 
ô ˆ6ƒ{aÒØä	B‹€Bä×BÑBØ	˜ Z°Ð=ó€Oð ×"Ñ"Ó$ó>Bñ 		ñ 	ØØØØØØÜœT¤&™\¨>Ó:ˆÜœD¤™L¨-Ó8ˆÜ!¤$¤v¡,Ð0CÓDÐÜ ¤¤f¡Ð/AÓBÐÜ!¤$¤v¡,Ð0CÓDÐÙÜØ˜|Ð-?ÐARôô ~‰~×*Ñ*Ô,Ð1CÀAÑ1F×1MÒ1MÜ×ÑØ"¤E§L¡L°¸UÔ$CÈ3öô ×ÑÐ 2°AÔ6áÜ ×-Ñ-¨lÓ;ˆLà˜1ÒáÜ×#Ñ# L°-À|ÖTä$×1Ñ1Ø  -°|ô ô 	×ÑÐ.°Ô4Ü×ÑØ ¨lÀ!ÀcÁ'õ	
ô × Ñ Ð!3°SÓ9ˆÜ×Ñ˜SÔ!ä×#Ñ#Ð$5°sÓ;ˆÜ×Ñ˜VÔ$Ü×Ñ˜F CÔ(Ü×Ñ˜F LÔ1ä×ÑÐ-¨sÔ3Ü×ÑÐ 1°6¸6ÈÈSÉÕQñ œ* R¬¯©Ô6Ü×Ñ ¨¨Ô,Ü×Ñ ¨vÖ6ä×Ñ ¨v¸b¸S×Añ}>Br.   )Úsingle_tensor_fnr"   c	                óz  — t         j                  j                  «       st        d„ |D «       «      st	        d«      ‚|€t        | |d¬«      \  }}|r)t         j                  j                  «       rt	        d«      ‚|r%t         j                  j                  «       st        }nt        } || |||||	|
||||||¬«       y)zvFunctional API that performs Adadelta algorithm computation.

    See :class:`~torch.optim.Adadelta` for details.
    c              3   óP   K  — | ]  }t        |t        j                  «      –— Œ  y ­wr\   )r%   r;   r   )rl   Úts     r-   rn   zadadelta.<locals>.<genexpr>³  s    è ø€ ò 5Ø()Œ
1”e—l‘l×#ñ5ùs   ‚$&zPAPI has changed, `state_steps` argument must contain a list of singleton tensorsNF)Ú	use_fusedz6torch.jit.script not supported with foreach optimizers)r   r   r    r!   r   r   r   rU   )
r;   rw   rx   ry   rQ   r
   r{   r|   r¤   r‰   )r   rD   rE   rF   rG   r   r"   r   rU   r   r   r    r!   r   r   Úfuncs                   r-   r   r   ˜  sÁ   € ô6 >‰>×&Ñ&Ô(´ñ 5Ø-8ô5ô 2ô Ø^ó
ð 	
ð
 €Ü1ØN¨eô
‰
ˆˆ7ñ ”5—9‘9×)Ñ)Ô+ÜÐSÓTÐTá”u—y‘y×-Ñ-Ô/Ü%‰ä&ˆáØØØØØØØØØ!ØØ%ØØör.   )FNFF)Útypingr   r   r   r   r;   r   Ú	optimizerr	   r
   r   r   r   r   r   r   r   r   r   r   r   r   Ú__all__r   Ú__doc__rc   r=   r`   r‰   r¤   r   rI   r.   r-   ú<module>r¯      s¨  ðç -Ó -ã Ý ÷÷ ÷ ÷ ð$ zÐ
"€ôaˆyô aðJð8	à	ˆð 
	ð 
ˆð 	Ø	Ðð 	Ø	ˆð 	Ø	Ðð ðñ90ð 	Ô ðj8%Ø‰Lð8%à‰<ð8%ð f‘ð8%ð V‘ð	8%ð
 f‘ð8%ð 	ð8%ð 
ð8%ð 
ð8%ð ð8%ð ð8%ð ð8%ð ð8%ð ó8%ðveBØ‰LðeBà‰<ðeBð f‘ðeBð V‘ð	eBð
 f‘ðeBð 	ðeBð 
ðeBð 
ðeBð ðeBð ðeBð ðeBð ðeBð óeBñP  Ð1HÔIð Ø"Ø Øñ=Ø‰Lð=à‰<ð=ð f‘ð=ð V‘ð	=ð
 f‘ð=ð ð=ð d‰^ð=ð ð=ð ð=ð 	ð=ð 
ð=ð 
ð=ð  ð!=ð" ò#=ó Jñ=r.   