Uploaded by

chamarilk

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views2 pages

RapidMiner-Data-Science-Foundations-Course-Description

Uploaded by

chamarilk

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

RapidMiner & Data Science: Foundations

Course Overview
RapidMiner & Data Science: Foundations is a two-day course focusing on data mining and predictive analytics with
RapidMiner Studio. Over the course of two days, students will explore a simplified business use case and build a
strong analytical model while becoming familiar with the graphical interface and the main product features and
functionality. They will also be introduced to basic concepts in modern data science and several popular machine
learning algorithms for predictive modeling.

The course is structured in a mentoring fashion where the entire group performs tasks alongside the instructor as
members of a data science team. After successfully completing this course, participants will have a solid
understanding of how RapidMiner Studio functions. Participants will be able to import data into RapidMiner from
common files types. They will be able to prepare data using common ETL transformations for data mining. They
will learn how to create and validate predictive models, and evaluate them using a variety of common model
performance criteria.

Practical exercises during the course prepare students to take the knowledge gained and apply it to their own
complex data challenges. The class exercises and labs are hands-on, so students will internalize the topics covered,
which will provide a jumpstart to the real world application of these techniques.

Prerequisites & Target Audience

This class is aimed at Analysts and Data Scientists. It assumes a basic knowledge of computer programming
principles and higher mathematics (through calculus), but does not require prior knowledge of RapidMiner
software or any academic preparation in applied statistics or data science.

Course Objectives
After the training, students will have the ability to use RapidMiner to:
● Perform all common data preparations and transformations for data mining
● Build strong analytical predictive models based on best-practice validation approaches
● Evaluate model quality with respect to several different performance criteria
● Deploy analytical predictive models

1
RapidMiner & Data Science: Foundations

Course Outline
● Overview
○ Introduction to the RapidMiner ecosystem
○ Business Scenario
○ Analytics Taxonomy & Hierarchy
○ CRISP-DM & Data Mining in the Enterprise
● Getting Started with RapidMiner Studio
○ User Interface
○ Creating and Managing RapidMiner Repositories
○ Operators and Processes
○ Storing Data, Processes, and Result Sets
● EDA: Exploratory Data Analysis
○ Loading Data
○ Quick Summary Statistics
○ Visualizing Data & Basic Charting
● Data Preparation
○ Basic Data ETL (Extract, Transform, and Load)
○ Data Types & Transformations of Value Types
○ Handling Missing Values
○ Handling Attribute Roles
○ Filtering Examples and Attributes
○ Normalization and Standardization
● Building Better Processes
○ Organizing, Renaming, & Relative Paths
○ Sub-Processes
○ Building Blocks
○ Breakpoints
● Predictive Modeling Algorithms
○ k-Nearest Neighbor
○ Naïve Bayes
○ Linear Regression
○ Decision Trees & Rules
● Model Construction and Evaluation
○ Machine Learning Theory: Bias, Variance, Overfitting & Underfitting
○ Splitting Data
○ Split and Cross Validation
○ Evaluation Methods & Performance Criteria
○ Optimization and Parameter Tuning
○ Applying Models

Grade 06 ICT 1st Term Test Paper 2023 English Medium Royal College
50% (4)
Grade 06 ICT 1st Term Test Paper 2023 English Medium Royal College
6 pages
Ahead DevOps Foundation STUDENT BINDER V3.0 PDF
100% (1)
Ahead DevOps Foundation STUDENT BINDER V3.0 PDF
189 pages
1 Tailieuthamkhao MachineLearning
No ratings yet
1 Tailieuthamkhao MachineLearning
151 pages
Log Mmsuperpatcher
No ratings yet
Log Mmsuperpatcher
395 pages
Data Science Syllabus: Foundations 40 - 100
No ratings yet
Data Science Syllabus: Foundations 40 - 100
4 pages
ML Foundation Using Python V1
No ratings yet
ML Foundation Using Python V1
3 pages
DSTBD_10-DMClassification-ENG
No ratings yet
DSTBD_10-DMClassification-ENG
160 pages
DICOM Conformance Statement MultiDiagnost Eleva FD R6.1
100% (3)
DICOM Conformance Statement MultiDiagnost Eleva FD R6.1
115 pages
Full Stack Data-Science AI, ChatGPT & Generative - 5
No ratings yet
Full Stack Data-Science AI, ChatGPT & Generative - 5
35 pages
Data Science Course Curriculum 27 Feb 2023
No ratings yet
Data Science Course Curriculum 27 Feb 2023
21 pages
G10 Powerpoint Presentation-1
No ratings yet
G10 Powerpoint Presentation-1
18 pages
AI, ML & DS Brochure
No ratings yet
AI, ML & DS Brochure
10 pages
No Code Data Science Outline
No ratings yet
No Code Data Science Outline
6 pages
Rapid Miner
No ratings yet
Rapid Miner
33 pages
Kamlesh Mooc File
No ratings yet
Kamlesh Mooc File
15 pages
NPTEL Coursebook
No ratings yet
NPTEL Coursebook
649 pages
MongoDB-for-Data-Science-seminar
No ratings yet
MongoDB-for-Data-Science-seminar
135 pages
AnalytixLabs - Data Science With Python
No ratings yet
AnalytixLabs - Data Science With Python
13 pages
Aula 1 - Programa Mestrado Data Mining I 201617 v2
No ratings yet
Aula 1 - Programa Mestrado Data Mining I 201617 v2
6 pages
Full Stack Project food website PPT Template
No ratings yet
Full Stack Project food website PPT Template
15 pages
Getting Started With Rapid Miner
No ratings yet
Getting Started With Rapid Miner
16 pages
It Agile Enterprise Architecture Operating Model Executive Brief V1
No ratings yet
It Agile Enterprise Architecture Operating Model Executive Brief V1
27 pages
DSTBD_9-DMassrules
No ratings yet
DSTBD_9-DMassrules
98 pages
Auditcoursesuyashlade 22
No ratings yet
Auditcoursesuyashlade 22
6 pages
19-DistributedDatabases
No ratings yet
19-DistributedDatabases
76 pages
15-QueryOptimization
No ratings yet
15-QueryOptimization
78 pages
01 - Introduction To Optimization S1
100% (1)
01 - Introduction To Optimization S1
119 pages
Chapter 2 - Relational Model and Languages
No ratings yet
Chapter 2 - Relational Model and Languages
21 pages
360digiTMG - Certificate Course On Data Science - Curriculum
No ratings yet
360digiTMG - Certificate Course On Data Science - Curriculum
12 pages
CDSP Course Outline 01 21 DRAFT
No ratings yet
CDSP Course Outline 01 21 DRAFT
3 pages
Course Outline
No ratings yet
Course Outline
2 pages
Rapidminer Report
No ratings yet
Rapidminer Report
28 pages
Syllabus Short Course Introduction To Data Science
No ratings yet
Syllabus Short Course Introduction To Data Science
1 page
DS Course Curriculum
No ratings yet
DS Course Curriculum
19 pages
20-ElasticSearch
No ratings yet
20-ElasticSearch
62 pages
Course Outline: SC Ence
No ratings yet
Course Outline: SC Ence
1 page
Data Pipelines with Apache Airflow 1st Edition Bas P Harenslak Julian Rutger De Ruiter - Download the ebook and start exploring right away
100% (1)
Data Pipelines with Apache Airflow 1st Edition Bas P Harenslak Julian Rutger De Ruiter - Download the ebook and start exploring right away
68 pages
Database Models
No ratings yet
Database Models
180 pages
BCP DRP
No ratings yet
BCP DRP
21 pages
Business Analytics Outline
No ratings yet
Business Analytics Outline
4 pages
Ansible Up and Running Automating Configuration Management and Deployment the Easy Way 1st Edition Lorin Hochstein 2024 Scribd Download
No ratings yet
Ansible Up and Running Automating Configuration Management and Deployment the Easy Way 1st Edition Lorin Hochstein 2024 Scribd Download
81 pages
CourseOutline FDS
No ratings yet
CourseOutline FDS
2 pages
Software Engineering-Unit-2
No ratings yet
Software Engineering-Unit-2
40 pages
Fundamental of Data Science
No ratings yet
Fundamental of Data Science
20 pages
Syllabus AI ML BlackBelt Program 3
No ratings yet
Syllabus AI ML BlackBelt Program 3
18 pages
Syllabus PDF
No ratings yet
Syllabus PDF
4 pages
18-Recovery
No ratings yet
18-Recovery
53 pages
Data Science - Toc (1)
No ratings yet
Data Science - Toc (1)
5 pages
FCH_IME672A_JAN_2018
No ratings yet
FCH_IME672A_JAN_2018
2 pages
MANAGEMENT-INFORMATION-SYSTEMS
No ratings yet
MANAGEMENT-INFORMATION-SYSTEMS
12 pages
14-PhysicalAccess
No ratings yet
14-PhysicalAccess
41 pages
Data-Science-Brochure-Nitttr&Webel
No ratings yet
Data-Science-Brochure-Nitttr&Webel
8 pages
CS 3307 Written Assignment Unit 2
No ratings yet
CS 3307 Written Assignment Unit 2
4 pages
AnalytixLabs - Data Science & Machine Learning With Python-1601625377114-1
No ratings yet
AnalytixLabs - Data Science & Machine Learning With Python-1601625377114-1
16 pages
Public Business Analytics ML AI
No ratings yet
Public Business Analytics ML AI
5 pages
What Is ASUS Backdoor ? Write Its Architecture, Methodology and Results For Which It Is Used
No ratings yet
What Is ASUS Backdoor ? Write Its Architecture, Methodology and Results For Which It Is Used
2 pages
K-means clustering using RapidMiner
No ratings yet
K-means clustering using RapidMiner
10 pages
Syllabus (AI & ML BlackBelt+ Program)
No ratings yet
Syllabus (AI & ML BlackBelt+ Program)
15 pages
correct-validation-wp-final-v
No ratings yet
correct-validation-wp-final-v
26 pages
Course Flyer Course Overview and Sample Certificate Together For Data Science Course
No ratings yet
Course Flyer Course Overview and Sample Certificate Together For Data Science Course
4 pages
Document
No ratings yet
Document
9 pages
jovanovicetal.2014RapidMinerBook
No ratings yet
jovanovicetal.2014RapidMinerBook
17 pages
Srikar_Veluvali_s_Resume
No ratings yet
Srikar_Veluvali_s_Resume
1 page
tutorial_rm5_prom6extension
No ratings yet
tutorial_rm5_prom6extension
20 pages
DSTBD_oracle_hints-IT
No ratings yet
DSTBD_oracle_hints-IT
11 pages
Lect 43 MemoryManagement
No ratings yet
Lect 43 MemoryManagement
16 pages
optimization
No ratings yet
optimization
4 pages
CCNA Exploration2: Routing Protocols - Chapter 1 Exam: Email Subscribtion
No ratings yet
CCNA Exploration2: Routing Protocols - Chapter 1 Exam: Email Subscribtion
9 pages
23.24 Chapter 01
No ratings yet
23.24 Chapter 01
35 pages
Brochure Big Data
No ratings yet
Brochure Big Data
6 pages
CS458 Lab01
No ratings yet
CS458 Lab01
5 pages
dmsyll
No ratings yet
dmsyll
2 pages
InfynasLeaningSolutions AI Machine Learining SDC
No ratings yet
InfynasLeaningSolutions AI Machine Learining SDC
6 pages
Answers_Assignment_B21_43
No ratings yet
Answers_Assignment_B21_43
7 pages
Document (1) (4)
No ratings yet
Document (1) (4)
1 page
Tutorial_DataMiningENG
No ratings yet
Tutorial_DataMiningENG
8 pages
590 Assignment 3 Final
No ratings yet
590 Assignment 3 Final
24 pages
V6I5-0268
No ratings yet
V6I5-0268
7 pages
Connect Synapse Workspace To Microsoft Purview - Azure Synapse Analytics - Microsoft Docs
No ratings yet
Connect Synapse Workspace To Microsoft Purview - Azure Synapse Analytics - Microsoft Docs
6 pages
Nuwanethi Obata Senehebara Amathumak
No ratings yet
Nuwanethi Obata Senehebara Amathumak
40 pages
Syllabus FDS
No ratings yet
Syllabus FDS
4 pages
Advanced Certification Course in Data Science - Brochure
No ratings yet
Advanced Certification Course in Data Science - Brochure
15 pages
Prime Classes Brochure
No ratings yet
Prime Classes Brochure
14 pages
Specification: Infinitt Pacs (+MR 3D) / Ris & Dosem 70,000 Exam License
No ratings yet
Specification: Infinitt Pacs (+MR 3D) / Ris & Dosem 70,000 Exam License
7 pages
BMSDP Log
No ratings yet
BMSDP Log
2 pages
Data_2
No ratings yet
Data_2
1 page
Data Sciences
No ratings yet
Data Sciences
4 pages
data science course fees Chennai
No ratings yet
data science course fees Chennai
4 pages
How To Read The DNS & HTTP Traffic Log
No ratings yet
How To Read The DNS & HTTP Traffic Log
3 pages
01_01_course-introduction.en
No ratings yet
01_01_course-introduction.en
2 pages
Data Science Portfolio
No ratings yet
Data Science Portfolio
17 pages
Project - One Project Management Platform: Projects
No ratings yet
Project - One Project Management Platform: Projects
1 page
WPML Multilingual Meta
No ratings yet
WPML Multilingual Meta
8 pages
Waterfall Model - Design
No ratings yet
Waterfall Model - Design
4 pages
Writing
No ratings yet
Writing
4 pages
WMM Final Updated
No ratings yet
WMM Final Updated
11 pages
Data Science Course Content Chapter 1: Introduction To Data Science
No ratings yet
Data Science Course Content Chapter 1: Introduction To Data Science
8 pages
Sorting Algorithms and Techniques: Definitive Reference for Developers and Engineers
From Everand
Sorting Algorithms and Techniques: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
Graph Data Modeling and Analytics with Neo4j: Definitive Reference for Developers and Engineers
From Everand
Graph Data Modeling and Analytics with Neo4j: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
Applied Data Mining with Weka: Definitive Reference for Developers and Engineers
From Everand
Applied Data Mining with Weka: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
Introduction to Robotics
From Everand
Introduction to Robotics
Swarnalata Verma
No ratings yet
C Data Structures and Algorithms: Implementing Efficient ADTs
From Everand
C Data Structures and Algorithms: Implementing Efficient ADTs
Larry Jones
No ratings yet
LightGBM in Practice: Definitive Reference for Developers and Engineers
From Everand
LightGBM in Practice: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
XGBoost in Practice: Definitive Reference for Developers and Engineers
From Everand
XGBoost in Practice: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
Technical Foundations of Torch: Definitive Reference for Developers and Engineers
From Everand
Technical Foundations of Torch: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
PyTorch Foundations and Applications: Definitive Reference for Developers and Engineers
From Everand
PyTorch Foundations and Applications: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
Contemporary Machine Learning Methods: Harnessing Scikit-Learn and TensorFlow
From Everand
Contemporary Machine Learning Methods: Harnessing Scikit-Learn and TensorFlow
Adam Jones
No ratings yet
data science course training in india hyderabad: innomatics research labs
From Everand
data science course training in india hyderabad: innomatics research labs
innomatics research labs
No ratings yet
PyTorch Essentials: A Comprehensive Guide to Machine Learning Techniques
From Everand
PyTorch Essentials: A Comprehensive Guide to Machine Learning Techniques
Adam Jones
No ratings yet
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: SUPPORT VECTOR MACHINE, LOGISTIC REGRESSION, DISCRIMINANT ANALYSIS and DECISION TREES: Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: SUPPORT VECTOR MACHINE, LOGISTIC REGRESSION, DISCRIMINANT ANALYSIS and DECISION TREES: Examples with MATLAB
César Pérez López
No ratings yet
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: NAIVE BAYES, NEAREST NEIGHBORS and NEURAL NETWORKS: Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: NAIVE BAYES, NEAREST NEIGHBORS and NEURAL NETWORKS: Examples with MATLAB
César Pérez López
No ratings yet
Practical Data Strategies and Recipes
From Everand
Practical Data Strategies and Recipes
Tom Henricksen
No ratings yet

Uploaded by

Uploaded by

RapidMiner & Data Science: Foundations

Prerequisites & Target Audience

You might also like