Rangkuman Webinar tanggal 27 September 2025 tentang Bangun Infrastruktur Optical Character Recognition (0CR) di atas Ubuntu secara on-premise

Nama : Adam Azhari

Kelas : XII TJKT 2

Sekolah : SMK DWIJA BHAKTI 1 JOMBANG

Poster Webinar:

Logo Radnet:

Rangkuman Materi:

Webinar ini ngebahas tuntas gimana caranya bikin sistem Optical Character Recognition (OCR) di atas Ubuntu, khususnya jalan di Virtual Machine. Bukan cuma install tools aja, tapi juga dari konsep dasar, cara setup environment, sampai trik biar sistem OCR bisa kepake beneran di dunia nyata.

Ngulik OCR di Ubuntu

Awalnya dijelasin dulu apa itu OCR dan alurnya. Mulai dari input dokumen atau gambar, dibersihin dulu pake preprocessing, baru kemudian teksnya dideteksi, dikenali, dan hasilnya bisa disimpen atau diproses lebih lanjut. Tools yang dibahas ada yang simpel kayak Tesseract, sampai framework deep learning kayak EasyOCR dan PaddleOCR yang lebih fleksibel buat kasus ribet kayak tulisan tangan atau dokumen miring.

Setup Environment

Biar OCR bisa jalan mulus, environment di Ubuntu VM harus disiapin dengan bener. Caranya mulai dari update sistem, install paket dasar, bikin Python environment, sampai masukin library penting kayak Tesseract, OpenCV, Pillow, dan pytesseract. Kalau punya GPU, bisa diaktifin juga biar performanya lebih cepat, apalagi kalau main di model deep learning.

Paket Ubuntu yang Wajib Ada

Ada beberapa paket yang emang penting banget buat OCR. Mulai dari build tools kayak build-essential dan cmake, paket inti OCR kayak tesseract-ocr dan libleptonica-dev, library buat gambar (libjpeg-dev, libpng-dev), sampai tools PDF kayak qpdf dan ghostscript. Kalau mau OCR-nya dijadiin service, bisa tambahin juga paket server kayak nginx atau docker.io.

Preprocessing Gambar

Bagian ini lumayan krusial biar hasil OCR makin akurat. Trik yang biasanya dipake antara lain lurusin dokumen yang miring (deskew), hapus noise, konversi ke hitam putih (thresholding), resize gambar biar lebih tajam, sampai segmentasi buat misahin blok teks.

Implementasi Praktis

Setelah environment siap, peserta diajak nyobain implementasi langsung. Misalnya bikin skrip sederhana pake Tesseract buat baca teks dari gambar. Bisa juga ditambahin language pack biar OCR bisa baca bahasa Indonesia. Supaya makin kepake, hasil OCR bisa dibungkus ke dalam API sederhana pake FastAPI, jadi bisa dipanggil dari aplikasi lain.

Deployment On-Premise

Kalau udah jalan, sistem OCR ini bisa di-deploy sesuai kebutuhan. Bisa langsung di VM, lebih rapi pake Docker, atau bahkan di-scale pake Kubernetes kalau workload-nya gede. Service biasanya di-expose lewat Nginx, terus ditambahin security kayak TLS dan autentikasi biar aman. Monitoring juga penting, jadi disarankan pake Prometheus atau Grafana buat nge-track performa dan error.

Best Practice dan Tips

Supaya sistem OCR tahan lama, ada beberapa tips yang disaranin. Jangan lupa backup rutin, pilih model sesuai kebutuhan (Tesseract cukup buat teks rapi, deep learning buat teks messy), dan selalu tes di berbagai dokumen biar tau akurasinya. Simpan hasil OCR di database biar gampang dicari lagi, dan kalau perlu bikin pipeline otomatis dari scan → OCR → simpan hasil.

Advanced Stuff

Buat yang mau ngulik lebih dalam, ada juga pembahasan tambahan kayak cara training model custom pake dataset sendiri, integrasi hasil OCR ke search engine biar bisa full-text search, optimasi model pake ONNX/TorchScript, sampai bikin OCR multilingual buat dokumen campur bahasa.

Link Website Radnet: https://radnet-digital.id/

Adam Azhari

Cari Blog Ini

Rangkuman tugas Cisco