Belajar Google Colab
Saya sedang belajar menggunakan Google Colab di MODUL 4 LK 4.1. Google Colab adalah layanan cloud gratis yang menyediakan Jupyter notebook. Fitur utamanya adalah: 1. Akses gratis ke GPU dan TPU untuk komputasi berat 2. Terhubung dengan Google Drive untuk menyimpan dan berbagi file 3. Tidak perlu pengaturan lokal, bisa diakses lewat browser 4. Mendukung banyak library Python untuk data science dan machine learning 5. Memungkinkan kolaborasi langsung antar pengguna 6. Menyediakan kode dan template untuk memulai proyek dengan cepat Google Colab sangat berguna untuk belajar, penelitian, dan proyek data science, machine learning, dan deep learning. Lembar Kerja ini membantu peserta belajar sintaks dasar pemrograman KA dan membuat aplikasi sederhana berbasis supervised atau unsupervised learning. Kegiatan dilakukan melalui proyek kolaboratif sesuai bidang keahlian masing-masing.
Proyek ini melibatkan penggunaan library KA populer, evaluasi model dengan alat yang tepat, dan penyusunan dokumentasi teknis lengkap. Tujuan setelah menyelesaikan lembar kerja ini, peserta diharapkan bisa: - Menggunakan sintaks dasar bahasa pemrograman KA untuk menulis skrip sederhana dengan logika KA. - Menggunakan library KA populer untuk membuat model sederhana, seperti klasifikasi teks/gambar. - Menganalisis hasil KA dengan matrik evaluasi dan memperbaiki kode untuk meningkatkan performa. - Menyusun dokumentasi teknis yang mencakup alur kerja, kode, dan analisis hasil aplikasi KA yang dibuat.
C.
Petunjuk
Kerja
1. Menulis skrip sederhana dengan sintaks dasar KA
|
buatkan sebuah skrip sederhana yang
menerima input suhu lalu mencetak a. "panas" jika suhu > 30, b.
"sejuk" jika suhu antara 20-30, c."dingin" jika suhu <
20. gunakan input(), int(), dan if-elif-else. tambahkan minimal 1 fungsi
untuk modulariasasi kode |
Output
|
def cek_suhu(suhu): """ Memeriksa
suhu dan mencetak kategori suhu. Args: suhu:
Suhu dalam bentuk integer.
""" if suhu > 30: print("panas") elif 20 <= suhu <= 30: print("sejuk") else: print("dingin") # Menerima input suhu
dari pengguna try: suhu_input = input("Masukkan suhu: ") suhu = int(suhu_input) # Memanggil fungsi untuk memeriksa suhu cek_suhu(suhu) except ValueError: print("Input tidak valid. Harap masukkan angka.") |
Contoh
|
cek_suhu(10) output: dingin |
2. Membangun model sederhana menggunakan library KA
-
Judul
Proyek
Prediksi
Kelulusan Siswa Berdasarkan Math Score, Reading Score, Writing Score.
-
Bahasa
& Library
Pyhton +
Scikit-learn
|
# Import library yang
diperlukan import seaborn as sns # Untuk memuat dataset dan visualisasi
awal import pandas as pd
# Untuk manipulasi
data import numpy as np
# Untuk operasi from sklearn.model_selection import train_test_split # Untuk membagi data from sklearn.linear_model import LogisticRegression # Model Logistic Regression from sklearn.metrics import accuracy_score, confusion_matrix,
classification_report # Metrik evaluasi import matplotlib.pyplot as plt # Untuk visualisasi |
-
Sumber
Dataset
Kaggle - https://www.kaggle.com/datasets/spscientist/students-performance-in-exams
-
Jumlah
Data & Fitur
1000 Data + 8
fitur (3 fitur yang digunakan untuk pengerjaan)
-
Deskripsi
Dataset
Dataset ini
berisi informasi tentang hasil ujian siswa di tiga mata pelajaran: matematika,
membaca, dan menulis. Setiap baris mewakili satu siswa, dan terdapat beberapa
fitur demografis serta nilai ujian yang dapat digunakan untuk analisis.
Variabel yang
ada pada dataset :
o
gender:
Jenis kelamin siswa (male atau female)
o
race/ethnicity:
Kelompok etnis siswa (Group A–E)
o
parental
level of education: Tingkat pendidikan tertinggi orang tua (misalnya:
bachelor's degree, some high school, dll)
o
lunch:
Jenis layanan makan siang yang diterima (standard atau free/reduced)
o
test
preparation course: Apakah siswa telah menyelesaikan kursus persiapan ujian
(none atau completed)
o
math
score: Nilai ujian matematika (0–100)
o
reading
score: Nilai ujian membaca (0–100)
o
writing
score: Nilai ujian menulis (0–100)
-
Alur
Kerja
1.
Memuat
Data
Meliputi
download data dari website kaggle dan memuat dari file komputer ke google
collab
2.
Standarisasi
Data
Mengubah data
dalam bentuk tabel. Kemudian cek apakah ada datang yang hilang atau tidak.
3.
Eskplorasi
dan Pembagian Data
Menampilkan
Statistika Deskriptifnya
Menampilkan
Visualisasi Data
Membagi data
training dan testing dengan rasio 80:20
4.
Membangun
dan Melatih Model Prediksi
Membuat dan
melatih model adalah proses inti dalam pengembangan sistem KA. Proses ini
dimulai dengan memilih algoritma atau pendekatan yang sesuai, seperti Linear
Regression, Logistic Regression, Random Forest, atau Neural Network, tergantung
pada jenis masalah yang ingin dipecahkan.
-
Potongan
Kode
|
-
# Import library yang diperlukan -
import seaborn as sns # Untuk memuat dataset dan visualisasi
awal -
import pandas as pd
# Untuk manipulasi
data -
import numpy as np
# Untuk operasi
numerik -
from
sklearn.model_selection import train_test_split
# Untuk membagi data -
from sklearn.linear_model import LogisticRegression # Model Logistic Regression -
from sklearn.metrics import accuracy_score, confusion_matrix,
classification_report # Metrik evaluasi -
import matplotlib.pyplot as plt # Untuk visualisasi -
|
|
Prompt : saya ingin mengupload file dari komputer yang saya
download dari kaggle Output |
|
Prompt : tampilkan datanya, pisahkan datanya berdasarkan ; |
|
Prompt : jadikan test preparation sebagai variabel target,
dan variabel fiturnya adalah math, reading, writing, |
|
Prompt : tampilkan statisik deskriptif, eksplorasi data
analisis dan visualisasi distribusi variabel numerik |
|
Prompt : bagi menjadi data training dan testing dengan rasio
80:20 |
|
Prompt : Membangun dan Melatih Model Logistic Regression. |
|
Prompt : evaluasi model mengguankan metode yang sesuai |
|
Prompt : buatkan interaktif pengguna untuk melakukan prediksi
|
-
Tools
Evaluasi
Evaluasi
Menggunakan Confusion Matrix.
Confusion
matrix dipilih sebagai alat evaluasi dalam regresi logistik karena mampu
memberikan gambaran yang lebih mendalam dan rinci mengenai performa model
klasifikasi, khususnya pada kasus klasifikasi biner. Berbeda dengan akurasi
yang hanya menunjukkan seberapa banyak prediksi yang benar, confusion matrix
menguraikan hasil prediksi ke dalam empat kategori: true positive, true
negative, false positive, dan false negative. Dengan pembagian ini, kita dapat
mengetahui jenis kesalahan apa yang sering dilakukan model, seperti apakah
model cenderung lebih sering salah memprediksi siswa yang sebenarnya gagal
sebagai lulus, atau sebaliknya.
-
Hasil
Evaluasi
Berdasarkan
output diperoleh nilai akurasi model = 0.7, ini menjelaskan bahwa model cukup
baik untuk digunakan dalam memprediksi hasil
|
|
-
Perbaikan
Model
Pada model
nilai accuracy menunjukan nilai 0.7, artinya model sudah cukup baik digunakan
untuk memprediksi. Sehingga tidak perlu untuk dilakukan perbaikan pada model
yang sudah dibuat.
-
Refleksi
Posting Komentar