0% found this document useful (0 votes)

9 views

pandas_notes

The document provides an introduction to the Pandas library, covering its installation, key data structures (Series and DataFrame), and various functionalities such as data manipulation, cleaning, aggregation, and visualization. It includes examples of creating Series and DataFrames, handling missing values, filtering data, and performing operations like merging and grouping. Additionally, it discusses working with time series data and offers basic plotting techniques for data visualization.

Uploaded by

ranjeet verma

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views

pandas_notes

Uploaded by

ranjeet verma

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

1.

Introduction to Pandas
Pandas is an open-source Python library for
data manipulation and analysis.
You can use Pandas to:

See who bought the most

Add a new column: "Did they tip?"
Save your customer list to a file
Find out the average number of lemonades bought
And you don’t need to count with fingers —
Pandas does it with just one line of code!
Install and Import:

pip install pandas

import pandas as pd

pd.__version__

Key Data Structures:

Series = one list

DataFrame = full table

2. Pandas Series
Create Series:

sales = pd.Series([2, 3, 5])

Indexing and Slicing:

sales[1]

sales[0:2]

Attributes:

sales.index

sales.values

sales.dtype
Methods:

sales.head()

sales.tail()

sales.sort_values()

sales.count()

sales.isnull()

Operations:

sales + 1

sales * 2

Missing Values:

sales_with_missing = pd.Series([2, None, 5])

sales_with_missing.isnull()

sales_with_missing.fillna(0)

3. Pandas DataFrame
Create DataFrame:

data = pd.DataFrame({

'Name': ['Anna', 'Ben'],

'Lemonades': [2, 3]

})

s1 = pd.Series(data=[1,2,3,4,5])

s2 = pd.Series(data=[10,20,30,40,50])

si = pd.Series(data=[100,200,300,400,500],index=list('abcde'))

data = pd.DataFrame({'C1':s1, 'C2':s2})

Attributes:
data.shape

data.columns

data.dtypes

Accessing Data:

# Using labels

data.loc[1,'C1']

# Using index

data.iloc[1,0]

Methods:

data.head()

data.tail()

data.info()

data.describe()

data.sort_values()

data.count()

data.isnull()

Filtering:

data[data['Lemonades'] > 2]

Adding, Updating, Deleting:

data['Tips'] = [1, 2]

data.loc[data['Name'] == 'X', 'Y'] = 6

data.rename(columns={'Name':'NAMEE'})

del data['Tips']

data = data.drop(columns=['Lemonades'])
4. Indexing and Selection
Set Index:

data.set_index('Name', inplace=True)

Reset Index:

data.reset_index(inplace=True)

MultiIndex Example:

multi_data = pd.DataFrame({

'Park': ['A', 'A', 'B', 'B'],

'Name': ['Anna','Ben','Chris','Daisy'],

'Lemonades': [2, 3, 4, 5]

}).set_index(['Park', 'Name'])

Selecting with Conditions:

multi_data[multi_data['Lemonades'] > 3]

Query Method:

multi_data.query('Lemonades > 3')

5. Working with Data
data.to_csv('lemonade_sales.csv')

data = pd.read_csv('lemonade_sales.csv')

dictt = {'x': [1, 2, 3], 'y': np.array([10, 20, 30]), 'z': 50}

pd.DataFrame(d)

listt = [[1, 2, 100], [2, 4, 100], [3, 8, 100]]

pd.DataFrame(listt, columns=['x', 'y', 'z'])

narr = np.array([[1, 2, 100], [2, 4, 100], [3, 8, 100]])

pd.DataFrame(narr, columns=['x', 'y', 'z'])

6. Data Cleaning and Preprocessing

Handling Missing Data:

data.dropna()

data.fillna(0)

data.isnull()

Remove Duplicates:

data.drop_duplicates()

Replace Values:

data.replace('lemondae', 'lemonade')

Type Conversion:

data['Lemonades'] = data['Lemonades'].astype(int)

String Operations:
data['Name'].str.upper()

7. Data Aggregation and Grouping

GroupBy Example:

grouped = data.groupby('Name')

grouped.sum()

Aggregations:

grouped['Lemonades'].mean()

grouped['Lemonades'].min()

grouped['Lemonades'].max()

Pivot Tables:

data.pivot_table(values='Lemonades', index='Name')

Crosstab:

pd.crosstab(data['Name'], data['Lemonades'])

8. Merging, Joining and Concatenating

Concatenation:

pd.concat([data1, data2])

Append:

data1.append(data2)

Merging:

pd.merge(data1, data2, on='Name')

Join on Index:
data1.join(data2.set_index('Name'), on='Name')

9. Working with Time Series

DateTime Index:

data['Date'] = pd.to_datetime(data['Date'])

data.set_index('Date', inplace=True)

Converting Strings to Dates:

pd.to_datetime('2025-04-29')

Resampling:

data.resample('W').sum()

Shifting/Lagging:

data['Previous Lemonades'] = data['Lemonades'].shift(1)

Rolling Calculations:

data['Rolling Average'] = data['Lemonades'].rolling(window=2).mean()

10. Data Visualization

Basic Plotting:

data['Lemonades'].plot()

Different ‘Kind’ of Plots:

data['Lemonades'].plot(kind='line')

data['Lemonades'].plot(kind='bar')

data['Lemonades'].plot(kind='barh')

data['Lemonades'].plot(kind='hist')

data['Lemonades'].plot(kind='box')

data['Lemonades'].plot(kind='scatter') #provide x&y axis data

data['Lemonades'].plot(kind='area')

data['Lemonades'].plot(kind='pie')

Customizations:

data['Lemonades'].plot(title='Lemonade Sales Over Time')

Pandas Notebook : Download here

Data Cleaning - Cheatsheet
100% (2)
Data Cleaning - Cheatsheet
8 pages
Pandas Cheat Sheet PDF
67% (3)
Pandas Cheat Sheet PDF
1 page
Learning Pandas PDF
No ratings yet
Learning Pandas PDF
171 pages
Getting Started with SAS Programming: Using SAS Studio in the Cloud
From Everand
Getting Started with SAS Programming: Using SAS Studio in the Cloud
Ron Cody
No ratings yet
ერიხ ფრომი სიყვარულის ხელოვნება PDF
67% (3)
ერიხ ფრომი სიყვარულის ხელოვნება PDF
174 pages
Supermarket Sales Data analysis
No ratings yet
Supermarket Sales Data analysis
6 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
5 pages
Content Pandas Cheat Sheet
No ratings yet
Content Pandas Cheat Sheet
9 pages
exp3 python (1)
No ratings yet
exp3 python (1)
15 pages
Pandas_Tutorial
No ratings yet
Pandas_Tutorial
9 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
2 pages
Commands SQL, Python (BASICS)
No ratings yet
Commands SQL, Python (BASICS)
7 pages
Pandas
No ratings yet
Pandas
13 pages
Pandas Notes
No ratings yet
Pandas Notes
3 pages
Important Pandas Operations 1697910759
No ratings yet
Important Pandas Operations 1697910759
6 pages
Pandas
No ratings yet
Pandas
9 pages
Pandas
No ratings yet
Pandas
4 pages
Introduction To Pandas in Data Analytics
No ratings yet
Introduction To Pandas in Data Analytics
12 pages
Pandas_Tutorial
No ratings yet
Pandas_Tutorial
7 pages
lab 1 ML lab
No ratings yet
lab 1 ML lab
15 pages
Pandas PDF(2)
No ratings yet
Pandas PDF(2)
25 pages
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
No ratings yet
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
7 pages
Pandas
No ratings yet
Pandas
26 pages
Pandas
No ratings yet
Pandas
5 pages
Interactive Data Analysis With Jupyter Cheatsheet 1731972443
No ratings yet
Interactive Data Analysis With Jupyter Cheatsheet 1731972443
10 pages
Python Cheat Sheet Code Academy
100% (1)
Python Cheat Sheet Code Academy
1 page
Data Science Cheat Sheet: KEY Imports
100% (1)
Data Science Cheat Sheet: KEY Imports
1 page
python interviews
No ratings yet
python interviews
154 pages
Practical File IP
No ratings yet
Practical File IP
27 pages
EDA with Pandas
No ratings yet
EDA with Pandas
8 pages
Data Exploration Preparation
No ratings yet
Data Exploration Preparation
12 pages
Dataframe in Pandas - Cheatsheet
No ratings yet
Dataframe in Pandas - Cheatsheet
8 pages
Data Aggregation and Group Operations
No ratings yet
Data Aggregation and Group Operations
34 pages
FDS Module 2 Notes
No ratings yet
FDS Module 2 Notes
24 pages
Programs of Python Pandas
No ratings yet
Programs of Python Pandas
15 pages
Intro Pandas
No ratings yet
Intro Pandas
18 pages
Data Analysis With Python
No ratings yet
Data Analysis With Python
60 pages
Pandas
No ratings yet
Pandas
44 pages
Acknowledgement
No ratings yet
Acknowledgement
25 pages
a5
No ratings yet
a5
28 pages
Universal Data Analytics Algorithm
No ratings yet
Universal Data Analytics Algorithm
51 pages
What is pandas
No ratings yet
What is pandas
9 pages
Reading An Entire File at Once: Generating Current Date
No ratings yet
Reading An Entire File at Once: Generating Current Date
2 pages
EDS - Python Cheat Sheet
0% (1)
EDS - Python Cheat Sheet
3 pages
Pandas
No ratings yet
Pandas
8 pages
Introduction to Pandas Programming 2
No ratings yet
Introduction to Pandas Programming 2
3 pages
python 2.1.2 (2)
No ratings yet
python 2.1.2 (2)
7 pages
Python-Pandas Notes
No ratings yet
Python-Pandas Notes
5 pages
Informatics Practices Practical File
No ratings yet
Informatics Practices Practical File
8 pages
Pandas Cheat Sheet - Python For Data Science
No ratings yet
Pandas Cheat Sheet - Python For Data Science
5 pages
Pandas Commands
No ratings yet
Pandas Commands
3 pages
Marking scheme practical paper (2)
No ratings yet
Marking scheme practical paper (2)
7 pages
Pandas Roadmap
No ratings yet
Pandas Roadmap
6 pages
Pandas
No ratings yet
Pandas
27 pages
Python CSBS Bhavya Lab Manual
No ratings yet
Python CSBS Bhavya Lab Manual
14 pages
Python Cheat Sheets
97% (33)
Python Cheat Sheets
11 pages
Mastering Pandas in Python: Course Book
From Everand
Mastering Pandas in Python: Course Book
Pedro Martins
No ratings yet
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet
Simplifying Data Science With Python
From Everand
Simplifying Data Science With Python
Billy David millican
No ratings yet
Data Science with R: Beginner to Expert
From Everand
Data Science with R: Beginner to Expert
Narayana Nemani
No ratings yet
Portfolio Eelco Maan - 06 - 2016
No ratings yet
Portfolio Eelco Maan - 06 - 2016
25 pages
Introduction To Ansys Software
No ratings yet
Introduction To Ansys Software
49 pages
Speech and Malocclusion
100% (1)
Speech and Malocclusion
36 pages
Estacion Multilinea Uso Exterior-M-326
No ratings yet
Estacion Multilinea Uso Exterior-M-326
2 pages
SDDocument MGCGBF6004
No ratings yet
SDDocument MGCGBF6004
2 pages
The Lifespan Self-Esteem Scale
No ratings yet
The Lifespan Self-Esteem Scale
14 pages
Introduction To Philosophy of The Human Person
100% (1)
Introduction To Philosophy of The Human Person
5 pages
PAG 12.1 - chemistry
No ratings yet
PAG 12.1 - chemistry
2 pages
Quantum University, Roorkee School of Technology: Strength of Materials Lab Manual
No ratings yet
Quantum University, Roorkee School of Technology: Strength of Materials Lab Manual
20 pages
P5647-Structural Calculation-40m Monopole VC
No ratings yet
P5647-Structural Calculation-40m Monopole VC
54 pages
Bharathi - 2
No ratings yet
Bharathi - 2
104 pages
Solar Energy Types and Uses
No ratings yet
Solar Energy Types and Uses
12 pages
DCS Working Temperature
No ratings yet
DCS Working Temperature
10 pages
High Speed Craft Rules
No ratings yet
High Speed Craft Rules
290 pages
Inset Edited Training Design Matrix
No ratings yet
Inset Edited Training Design Matrix
5 pages
Senior High School Research Paper Format Final
No ratings yet
Senior High School Research Paper Format Final
41 pages
Maths Class Xii Sample Paper Test 01 For Board Exam 2023
No ratings yet
Maths Class Xii Sample Paper Test 01 For Board Exam 2023
6 pages
Ac Lab Viva
No ratings yet
Ac Lab Viva
12 pages
Te Brochure Uk 12apr22 Screen
No ratings yet
Te Brochure Uk 12apr22 Screen
52 pages
Wps
No ratings yet
Wps
4 pages
Illustration Thesis Examples
100% (3)
Illustration Thesis Examples
7 pages
HW5e Int International Wordlist
100% (1)
HW5e Int International Wordlist
34 pages
Cavitation Apparatus FM 1849 21
No ratings yet
Cavitation Apparatus FM 1849 21
15 pages
A Study On Factor of Purchasing Durable Good in Kolkata, West Bengal
No ratings yet
A Study On Factor of Purchasing Durable Good in Kolkata, West Bengal
4 pages
Kingspan TW55 Insulation
No ratings yet
Kingspan TW55 Insulation
12 pages
Download full Vertically Integrated Architectures: Versioned Data Models, Implicit Services, and Persistence-Aware Programming 1st Edition Jos Jong ebook all chapters
100% (1)
Download full Vertically Integrated Architectures: Versioned Data Models, Implicit Services, and Persistence-Aware Programming 1st Edition Jos Jong ebook all chapters
55 pages
Cytotoxicity Evaluation of Sodium Lauryl Sulfate in A Paper-Based
No ratings yet
Cytotoxicity Evaluation of Sodium Lauryl Sulfate in A Paper-Based
10 pages
Full Download Artificial Intelligence Accelerates Human Learning Discussion Data Analytics Katashi Nagao PDF DOCX
No ratings yet
Full Download Artificial Intelligence Accelerates Human Learning Discussion Data Analytics Katashi Nagao PDF DOCX
65 pages
Internship Report
No ratings yet
Internship Report
33 pages

Uploaded by

Uploaded by

1.

See who bought the most

pip install pandas

Key Data Structures:

DataFrame = full table

sales = pd.Series([2, 3, 5])

Indexing and Slicing:

sales_with_missing = pd.Series([2, None, 5])

'Name': ['Anna', 'Ben'],

data = pd.DataFrame({'C1':s1, 'C2':s2})

Adding, Updating, Deleting:

data.loc[data['Name'] == 'X', 'Y'] = 6

'Park': ['A', 'A', 'B', 'B'],

Selecting with Conditions:

multi_data.query('Lemonades > 3')

listt = [[1, 2, 100], [2, 4, 100], [3, 8, 100]]

pd.DataFrame(listt, columns=['x', 'y', 'z'])

narr = np.array([[1, 2, 100], [2, 4, 100], [3, 8, 100]])

pd.DataFrame(narr, columns=['x', 'y', 'z'])

6. Data Cleaning and Preprocessing

7. Data Aggregation and Grouping

8. Merging, Joining and Concatenating

pd.merge(data1, data2, on='Name')

9. Working with Time Series

Converting Strings to Dates:

data['Previous Lemonades'] = data['Lemonades'].shift(1)

data['Rolling Average'] = data['Lemonades'].rolling(window=2).mean()

10. Data Visualization

Different ‘Kind’ of Plots:

data['Lemonades'].plot(kind='scatter') #provide x&y axis data

data['Lemonades'].plot(title='Lemonade Sales Over Time')

Pandas Notebook : Download here

You might also like