LR不使用MSE而使用交叉熵损失函数的原因

区块链毕设网qklbishe.com为您提供问题的解答

LR不使用MSE而使用交叉熵损失函数的原因

主要考虑CE和MSE的梯度更新公式,MSE的参数更新公式中,有sigmod导数的乘项,而sigmod在输入很大或很小时,导数趋近于0,所以即使此时loss很大,梯度也很小,导致LR收敛很慢。 而使用CE loss时,参数更新时为(sigmod(z)-y)loss 越大 梯度越大,加快收敛速度。
29:50

以上就是关于问题LR不使用MSE而使用交叉熵损失函数的原因的答案

欢迎关注区块链毕设网-
专业区块链毕业设计成品源码,定制。

区块链NFT链游项目方科学家脚本开发培训

承接区块链项目定制开发

微信:btc9767

QQ :1330797917

TELEGRAM: BTCOK9

承接区块链项目定制开发


qklbishe.com区块链毕设代做网专注|以太坊fabric-计算机|java|毕业设计|代做平台-javagopython毕设 » LR不使用MSE而使用交叉熵损失函数的原因

发表回复