Postingan

Belajar Google Colab

Saya sedang belajar menggunakan Google Colab di MODUL 4 LK 4.1. Google Colab adalah layanan cloud gratis yang menyediakan Jupyter notebook. Fitur utamanya adalah: 1. Akses gratis ke GPU dan TPU untuk komputasi berat 2. Terhubung dengan Google Drive untuk menyimpan dan berbagi file 3. Tidak perlu pengaturan lokal, bisa diakses lewat browser 4. Mendukung banyak library Python untuk data science dan machine learning 5. Memungkinkan kolaborasi langsung antar pengguna 6. Menyediakan kode dan template untuk memulai proyek dengan cepat Google Colab sangat berguna untuk belajar, penelitian, dan proyek data science, machine learning, dan deep learning. Lembar Kerja ini membantu peserta belajar sintaks dasar pemrograman KA dan membuat aplikasi sederhana berbasis supervised atau unsupervised learning. Kegiatan dilakukan melalui proyek kolaboratif sesuai bidang keahlian masing-masing.

Proyek ini melibatkan penggunaan library KA populer, evaluasi model dengan alat yang tepat, dan penyusunan dokumentasi teknis lengkap. Tujuan setelah menyelesaikan lembar kerja ini, peserta diharapkan bisa: - Menggunakan sintaks dasar bahasa pemrograman KA untuk menulis skrip sederhana dengan logika KA. - Menggunakan library KA populer untuk membuat model sederhana, seperti klasifikasi teks/gambar. - Menganalisis hasil KA dengan matrik evaluasi dan memperbaiki kode untuk meningkatkan performa. - Menyusun dokumentasi teknis yang mencakup alur kerja, kode, dan analisis hasil aplikasi KA yang dibuat.

C. Petunjuk Kerja

1. Menulis skrip sederhana dengan sintaks dasar KA

buatkan sebuah skrip sederhana yang menerima input suhu lalu mencetak a. "panas" jika suhu > 30, b. "sejuk" jika suhu antara 20-30, c."dingin" jika suhu < 20. gunakan input(), int(), dan if-elif-else. tambahkan minimal 1 fungsi untuk modulariasasi kode

Output

def cek_suhu(suhu):

"""

Memeriksa suhu dan mencetak kategori suhu.

Args:

suhu: Suhu dalam bentuk integer.

"""

if suhu > 30:

print("panas")

elif 20 <= suhu <= 30:

print("sejuk")

else:

print("dingin")

# Menerima input suhu dari pengguna

try:

suhu_input = input("Masukkan suhu: ")

suhu = int(suhu_input)

# Memanggil fungsi untuk memeriksa suhu

cek_suhu(suhu)

except ValueError:

print("Input tidak valid. Harap masukkan angka.")

Contoh

cek_suhu(10)

output:

dingin

2. Membangun model sederhana menggunakan library KA

- Judul Proyek

Prediksi Kelulusan Siswa Berdasarkan Math Score, Reading Score, Writing Score.

- Bahasa & Library

Pyhton + Scikit-learn

# Import library yang diperlukan

import seaborn as sns # Untuk memuat dataset dan visualisasi awal

import pandas as pd # Untuk manipulasi data

import numpy as np # Untuk operasi

from sklearn.model_selection import train_test_split # Untuk membagi data

from sklearn.linear_model import LogisticRegression # Model Logistic Regression

from sklearn.metrics import accuracy_score, confusion_matrix, classification_report # Metrik evaluasi

import matplotlib.pyplot as plt # Untuk visualisasi

- Sumber Dataset

Kaggle - https://www.kaggle.com/datasets/spscientist/students-performance-in-exams

- Jumlah Data & Fitur

1000 Data + 8 fitur (3 fitur yang digunakan untuk pengerjaan)

- Deskripsi Dataset

Dataset ini berisi informasi tentang hasil ujian siswa di tiga mata pelajaran: matematika, membaca, dan menulis. Setiap baris mewakili satu siswa, dan terdapat beberapa fitur demografis serta nilai ujian yang dapat digunakan untuk analisis.

Variabel yang ada pada dataset :

o gender: Jenis kelamin siswa (male atau female)

o race/ethnicity: Kelompok etnis siswa (Group A–E)

o parental level of education: Tingkat pendidikan tertinggi orang tua (misalnya: bachelor's degree, some high school, dll)

o lunch: Jenis layanan makan siang yang diterima (standard atau free/reduced)

o test preparation course: Apakah siswa telah menyelesaikan kursus persiapan ujian (none atau completed)

o math score: Nilai ujian matematika (0–100)

o reading score: Nilai ujian membaca (0–100)

o writing score: Nilai ujian menulis (0–100)

- Alur Kerja

1. Memuat Data

Meliputi download data dari website kaggle dan memuat dari file komputer ke google collab

2. Standarisasi Data

Mengubah data dalam bentuk tabel. Kemudian cek apakah ada datang yang hilang atau tidak.

3. Eskplorasi dan Pembagian Data

Menampilkan Statistika Deskriptifnya

Menampilkan Visualisasi Data

Membagi data training dan testing dengan rasio 80:20

4. Membangun dan Melatih Model Prediksi

Membuat dan melatih model adalah proses inti dalam pengembangan sistem KA. Proses ini dimulai dengan memilih algoritma atau pendekatan yang sesuai, seperti Linear Regression, Logistic Regression, Random Forest, atau Neural Network, tergantung pada jenis masalah yang ingin dipecahkan.

- Potongan Kode

- # Import library yang diperlukan

- import seaborn as sns # Untuk memuat dataset dan visualisasi awal

- import pandas as pd # Untuk manipulasi data

- import numpy as np # Untuk operasi numerik

- from sklearn.model_selection import train_test_split # Untuk membagi data

- from sklearn.linear_model import LogisticRegression # Model Logistic Regression

- from sklearn.metrics import accuracy_score, confusion_matrix, classification_report # Metrik evaluasi

- import matplotlib.pyplot as plt # Untuk visualisasi

Prompt : saya ingin mengupload file dari komputer yang saya download dari kaggle

Output

Prompt : tampilkan datanya, pisahkan datanya berdasarkan ;

Prompt : jadikan test preparation sebagai variabel target, dan variabel fiturnya adalah math, reading, writing,

Prompt : tampilkan statisik deskriptif, eksplorasi data analisis dan visualisasi distribusi variabel numerik

Prompt : bagi menjadi data training dan testing dengan rasio 80:20

Prompt : Membangun dan Melatih Model Logistic Regression.

Prompt : evaluasi model mengguankan metode yang sesuai

Prompt : buatkan interaktif pengguna untuk melakukan prediksi

- Tools Evaluasi

Evaluasi Menggunakan Confusion Matrix.

Confusion matrix dipilih sebagai alat evaluasi dalam regresi logistik karena mampu memberikan gambaran yang lebih mendalam dan rinci mengenai performa model klasifikasi, khususnya pada kasus klasifikasi biner. Berbeda dengan akurasi yang hanya menunjukkan seberapa banyak prediksi yang benar, confusion matrix menguraikan hasil prediksi ke dalam empat kategori: true positive, true negative, false positive, dan false negative. Dengan pembagian ini, kita dapat mengetahui jenis kesalahan apa yang sering dilakukan model, seperti apakah model cenderung lebih sering salah memprediksi siswa yang sebenarnya gagal sebagai lulus, atau sebaliknya.

- Hasil Evaluasi

Berdasarkan output diperoleh nilai akurasi model = 0.7, ini menjelaskan bahwa model cukup baik untuk digunakan dalam memprediksi hasil

- Perbaikan Model

Pada model nilai accuracy menunjukan nilai 0.7, artinya model sudah cukup baik digunakan untuk memprediksi. Sehingga tidak perlu untuk dilakukan perbaikan pada model yang sudah dibuat.

- Refleksi

kodingka

Belajar Google Colab

Posting Komentar