0% found this document useful (0 votes)

95 views9 pages

Vanishing and Exploding

Gradient descent vanishing and exploding issues arise due to the chain rule in backpropagation. The vanishing gradient problem occurs when the gradients become extremely small during backpropagation, making learning very slow. The exploding gradient problem is the opposite, where the gradients grow extremely large, making the neural network highly unstable. Both issues can be addressed using techniques like gradient clipping or initializing weights properly.

Uploaded by

logi9361

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

95 views9 pages

Vanishing and Exploding

Uploaded by

logi9361

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 9

Gradient descent vanishing

& exploding
By
LOGESHWARI P
(CB.EN.P2BME23009)
GRADIENT DESCENT

Gradient descent is an optimization algorithm which is

commonly-used to train machine learning models and neural
networks.
Chain rule in back propagation
Vanishing gradient
Exploding gradient
• Softmax and sigmoid are both activation functions commonly used in machine learning for • 4. **Independence:**
different purposes. Let's compare them in terms of their characteristics and use cases:
• - **Softmax:** The probabilities sum to 1, and the output for one class is dependent on
the scores of other classes.
• 1. **Function Form:** • - **Sigmoid:** Each sigmoid output is independent of the others. It's applied element-
wise to each output node.
• - **Softmax:** It is used for multi-class classification problems. The softmax function
takes a vector of arbitrary real-valued scores and squashes them to a probability distribution
over multiple classes. The output is a vector of probabilities that sum to 1.
• 5. **Numerical Stability:**
• - **Sigmoid:** It is used for binary classification problems. The sigmoid function takes a
real-valued input and squashes it to the range [0, 1]. It's commonly used to produce the • - **Softmax:** The softmax function involves exponentiation, and in practice, it can be
probability of belonging to a particular class. sensitive to large input values, potentially leading to numerical instability issues.
• - **Sigmoid:** Generally more numerically stable compared to softmax.

• 2. **Output Range:**
• - **Softmax:** Produces a probability distribution over multiple classes, with each • 6. **Derivative:**
element in the range (0, 1). The sum of all elements in the output vector is 1.
• - **Softmax:** The derivative of the softmax function involves multiple terms, and it's
• - **Sigmoid:** Produces an output in the range (0, 1) and is suitable for binary often used in conjunction with the cross-entropy loss during backpropagation in
classification problems. It can be interpreted as the probability of belonging to the positive classification tasks.
class.
• - **Sigmoid:** The derivative of the sigmoid function has a simple and interpretable
form, making it computationally efficient during backpropagation.

• 3. **Application:**
• - **Softmax:** Typically used in the output layer of a neural network for multi-class • In summary, softmax is suitable for multi-class classification tasks, while sigmoid is
classification problems. It's especially useful when there are more than two classes. commonly used in binary classification problems. The choice between them depends on the
nature of the task and the number of classes involved.
• - **Sigmoid:** Commonly used in binary classification problems. It's also used in the
hidden layers of neural networks to model non-linear relationships in the data.

Data Mining 5 Units Notes
No ratings yet
Data Mining 5 Units Notes
85 pages
DR External Axis Controller (1L4805A-E-3) PDF
No ratings yet
DR External Axis Controller (1L4805A-E-3) PDF
160 pages
Allocation Methods
No ratings yet
Allocation Methods
20 pages
Unit 1 DataScience
No ratings yet
Unit 1 DataScience
105 pages
Assignment I Data Analytics
No ratings yet
Assignment I Data Analytics
3 pages
Data Science Techniques Classification Regression and Clustering
No ratings yet
Data Science Techniques Classification Regression and Clustering
5 pages
ds4015-big-data-analytics-vignesh-k-notes
No ratings yet
ds4015-big-data-analytics-vignesh-k-notes
146 pages
Attribute Oriented Induction
100% (1)
Attribute Oriented Induction
6 pages
Convolution Neural Networks U2
No ratings yet
Convolution Neural Networks U2
24 pages
Data Science Notes
No ratings yet
Data Science Notes
10 pages
Mfcs PPT (All Units)
No ratings yet
Mfcs PPT (All Units)
103 pages
R22-Ids-Question Bank
No ratings yet
R22-Ids-Question Bank
4 pages
Big Data Unit 2
No ratings yet
Big Data Unit 2
19 pages
Ec6302 - Digital Electronics Question Bank Unit - I Minimization Techniques and Logic Gates
No ratings yet
Ec6302 - Digital Electronics Question Bank Unit - I Minimization Techniques and Logic Gates
12 pages
Rayleigh Model
No ratings yet
Rayleigh Model
9 pages
Q&A Univ 3unit
No ratings yet
Q&A Univ 3unit
18 pages
Data Mining: Concepts and Techniques: - Chapter 5
No ratings yet
Data Mining: Concepts and Techniques: - Chapter 5
63 pages
Regression: Unit Iii
No ratings yet
Regression: Unit Iii
54 pages
Object Oriented Analysis and Design - Syllabus
No ratings yet
Object Oriented Analysis and Design - Syllabus
1 page
FDS Iat-2 Part-B
No ratings yet
FDS Iat-2 Part-B
4 pages
Data Mining - Discretization
100% (1)
Data Mining - Discretization
5 pages
13-Mca-Or-Probability & Statistics
No ratings yet
13-Mca-Or-Probability & Statistics
3 pages
ccs346-eda-unit-1-notes
No ratings yet
ccs346-eda-unit-1-notes
20 pages
Classification and Prediction
No ratings yet
Classification and Prediction
126 pages
DAP Lab Manual
No ratings yet
DAP Lab Manual
20 pages
Unit 1 - Machine Learning
No ratings yet
Unit 1 - Machine Learning
21 pages
Iot Unit 3
No ratings yet
Iot Unit 3
4 pages
IML-IITKGP - Assignment 7 Solution
No ratings yet
IML-IITKGP - Assignment 7 Solution
8 pages
Programming in C - CS3251 - HandWritten Notes - Un_250316_200237
No ratings yet
Programming in C - CS3251 - HandWritten Notes - Un_250316_200237
38 pages
SC&RP - Unit 5
No ratings yet
SC&RP - Unit 5
36 pages
BDA Unit 1-1
No ratings yet
BDA Unit 1-1
21 pages
Unit-2 Solution
No ratings yet
Unit-2 Solution
22 pages
Lab 1: Preprocessing Using Python
No ratings yet
Lab 1: Preprocessing Using Python
5 pages
12-Exploratory Data Analysis, Anomaly Detection-28!03!2023
No ratings yet
12-Exploratory Data Analysis, Anomaly Detection-28!03!2023
79 pages
ccs346 Eda
No ratings yet
ccs346 Eda
2 pages
Unit 2 Fod
No ratings yet
Unit 2 Fod
27 pages
Unit II Data Analytics
No ratings yet
Unit II Data Analytics
17 pages
Syllabus
No ratings yet
Syllabus
9 pages
Unit 5 Fod (1) (Repaired)
No ratings yet
Unit 5 Fod (1) (Repaired)
28 pages
006 Practical List of DM-2023
No ratings yet
006 Practical List of DM-2023
1 page
Knowledge Representation in Data Mining
No ratings yet
Knowledge Representation in Data Mining
22 pages
East West Institute of Technology: Sadp Notes
No ratings yet
East West Institute of Technology: Sadp Notes
30 pages
Pincer Search Algo
No ratings yet
Pincer Search Algo
8 pages
Unit-5 Alt
No ratings yet
Unit-5 Alt
15 pages
Soft Computing
No ratings yet
Soft Computing
13 pages
Data Engineering UNIT-1
No ratings yet
Data Engineering UNIT-1
14 pages
Data Analytics Lab File Rohit
No ratings yet
Data Analytics Lab File Rohit
23 pages
Lecture - 2 Classification (Machine Learning Basic and KNN)
No ratings yet
Lecture - 2 Classification (Machine Learning Basic and KNN)
94 pages
NLP - Srilakshmi H - PPT Assignment
No ratings yet
NLP - Srilakshmi H - PPT Assignment
29 pages
Unit 5
No ratings yet
Unit 5
27 pages
Data Mining & Business Intelligence (2170715) : Unit-5 Concept Description and Association Rule Mining
No ratings yet
Data Mining & Business Intelligence (2170715) : Unit-5 Concept Description and Association Rule Mining
39 pages
IV_AI-DS_AD3491_FDSA_Unit4
No ratings yet
IV_AI-DS_AD3491_FDSA_Unit4
30 pages
7th Sem 1
No ratings yet
7th Sem 1
32 pages
Data Analytics and Reporting - Notes Unit 1 and 2
No ratings yet
Data Analytics and Reporting - Notes Unit 1 and 2
11 pages
3 Unit - Dspu
No ratings yet
3 Unit - Dspu
23 pages
Fdsa UNIT V
No ratings yet
Fdsa UNIT V
18 pages
Introduction: Data Analytic Thinking
No ratings yet
Introduction: Data Analytic Thinking
38 pages
Nikhil MOOC Report
No ratings yet
Nikhil MOOC Report
16 pages
Computer Science (Optional II) Grade 9-10: Micro Syllabus - Academic Year 2069
100% (1)
Computer Science (Optional II) Grade 9-10: Micro Syllabus - Academic Year 2069
6 pages
TRHHTRH
No ratings yet
TRHHTRH
84 pages
WINSEM2024-25_CSE4006_ETH_AP2024254000689_2025-01-03_Reference-Material-I
No ratings yet
WINSEM2024-25_CSE4006_ETH_AP2024254000689_2025-01-03_Reference-Material-I
39 pages
HCMUT Internship Report DoanTienThong
No ratings yet
HCMUT Internship Report DoanTienThong
21 pages
Various Interface Styles
No ratings yet
Various Interface Styles
45 pages
Murach s ASP NET Core MVC 1st Edition Mary Delamater download
100% (1)
Murach s ASP NET Core MVC 1st Edition Mary Delamater download
53 pages
Project-proposal-Bike Sales and Inventory-System-Management
No ratings yet
Project-proposal-Bike Sales and Inventory-System-Management
6 pages
Cncvietpro DDCS V3.1
No ratings yet
Cncvietpro DDCS V3.1
44 pages
TE7 - CE&FDA - DICOM Quick Guide & FAQ Manul - V2.0 - EN
No ratings yet
TE7 - CE&FDA - DICOM Quick Guide & FAQ Manul - V2.0 - EN
50 pages
C#.Net AAT Report
No ratings yet
C#.Net AAT Report
65 pages
Frontend Engineer Techincal Test
No ratings yet
Frontend Engineer Techincal Test
2 pages
Manual Mack
100% (8)
Manual Mack
184 pages
7.2.2 MM-J1IEX-Incoming Excise Invoice
No ratings yet
7.2.2 MM-J1IEX-Incoming Excise Invoice
6 pages
General Purpose Simulation System (GPSS)
No ratings yet
General Purpose Simulation System (GPSS)
14 pages
Data Base Assignment 2024
No ratings yet
Data Base Assignment 2024
12 pages
170-177+MANISHA+RANGA (1)
No ratings yet
170-177+MANISHA+RANGA (1)
8 pages
Layered Windows
No ratings yet
Layered Windows
7 pages
EN FB Company Brochure
No ratings yet
EN FB Company Brochure
40 pages
Ankur IndiaBulls
No ratings yet
Ankur IndiaBulls
7 pages
Activity Book Answer Key
No ratings yet
Activity Book Answer Key
7 pages
Standard Normal Deviate
No ratings yet
Standard Normal Deviate
2 pages
case study 1 on cloud standard by IT59 TUSHAR BISANE
No ratings yet
case study 1 on cloud standard by IT59 TUSHAR BISANE
7 pages
Vector Space Model
No ratings yet
Vector Space Model
11 pages
Lab Report No. 1
No ratings yet
Lab Report No. 1
8 pages
List of HEIs in The NCR
No ratings yet
List of HEIs in The NCR
7 pages
Assignment Day 4 - 25th June 2020: in The Community
No ratings yet
Assignment Day 4 - 25th June 2020: in The Community
4 pages
User Manual: Samsung Medison Diagnostic Ultrasound System
100% (1)
User Manual: Samsung Medison Diagnostic Ultrasound System
702 pages
Sandblast Battle Card
No ratings yet
Sandblast Battle Card
3 pages
D-LINK Setup Manual
No ratings yet
D-LINK Setup Manual
61 pages
Via Ivrea 8b 10098 Rivoli - (To) Italy Phone +39 011 9573423
No ratings yet
Via Ivrea 8b 10098 Rivoli - (To) Italy Phone +39 011 9573423
2 pages
Eiki Xb41 Service Manual
No ratings yet
Eiki Xb41 Service Manual
108 pages

Uploaded by

Uploaded by

Gradient descent vanishing

Gradient descent is an optimization algorithm which is

You might also like