COMPUTER VISION DAN BROWSING AUDIO DATA
A.
COMPUTER
VISION
Computer
Vision adalah ilmu dan teknologi mesin yang melihat, di mana mesin mampu
mengekstrak informasi dari gambar yang diperlukan untuk menyelesaikan tugas
tertentu. Sebagai suatu disiplin ilmu, visi komputer
berkaitan dengan teori di balik sistem buatan bahwa ekstrak informasi dari
gambar. Data gambar dapat mengambil banyak bentuk, seperti urutan video, pandangan
dari beberapa kamera, atau data multi-dimensi dari scanner medis. Sedangkan
sebagai disiplin teknologi, computer vision berusaha
untuk menerapkan teori dan model untuk pembangunan sistem computer vision.
Computer
Vision didefinisikan sebagai salah satu cabang ilmu pengetahuan yang
mempelajari bagaimana komputer dapat mengenali obyek yang diamati. Cabang ilmu
ini bersama Artificial Intelligence akan mampu menghasilkanVisual Intelligence
System. Perbedaannya adalah Computer
Vision lebih mempelajari bagaimana komputer dapat mengenali obyek yang diamati. Namunkomputer grafik lebih ke arah pemanipulasian gambar (visual)
secara digital. Bentuk sederhana dari grafik komputer adalah grafik
komputer 2D yang kemudian berkembang menjadi grafik komputer 3D, pemrosesan
citra, dan pengenalan pola. Grafik komputer sering dikenal dengan istilah visualisasi data.
Computer
Vision adalah kombinasi antara :
·
Pengolahan Citra (Image Processing), bidang yang
berhubungan dengan proses transformasi citra/gambar (image). Proses ini
bertujuan untuk mendapatkan kualitas citra yang lebih baik.
·
Pengenalan Pola (Pattern Recognition), bidang ini
berhubungan dengan proses identifikasi obyek pada citra atau interpretasi
citra. Proses ini bertujuan untuk mengekstrak informasi/pesan yang disampaikan
oleh gambar/citra.
Fungsi / Proses pada Computer Vision
Untuk menunjang tugas Computer
Vision, terdapat beberapa fungsi pendukung ke dalam sistem ini, yaitu :
1. Proses
penangkapan citra (Image Acquisition)
·
Image Acqusition pada manusia dimulai dengan mata,
kemudian informasi visual diterjemahkan ke dalam suatu format yang kemudian
dapat dimanipulasi oleh otak.
·
Senada dengan proses di atas, computer vision
membutuhkan sebuah mata untuk menangkap sebuah sinyal visual.
·
Umumnya mata pada computer vision adalah sebuah kamera
video.
·
Kamera menerjemahkan sebuah scene atau image.
·
Keluaran dari kamera adalah berupa sinyal analog,
dimana frekuensi dan amplitudonya (frekuensi berhubungan dengan jumlah sinyal
dalam satu detik, sedangkan amplitudo berkaitan dengan tingginya sinyal listrik
yang dihasilkan) merepresentasikan detail ketajaman (brightness) pada scene.
·
Kamera mengamati sebuah kejadian pada satu jalur dalam
satu waktu, memindainya dan membaginyamenjadi ratusan garis horizontal yang
sama.
·
Tiap‐tiap garis membuat sebuah sinyal analog yang
amplitudonya menjelaskan perubahan brightness sepanjang garis sinyal tersebut.
·
Kemudian sinyal listrik ini diubah menjadi bilangan
biner yang akan digunakan oleh komputer untuk pemrosesan.
·
Karena komputer tidak bekerja dengan sinyal analog,
maka sebuah analog‐to‐digital converter (ADC), dibutuhkan untuk memproses semua
sinyal tersebut oleh komputer.
·
ADC ini akan mengubah sinyal analog yang
direpresentasikan dalam bentuk informasi sinyal tunggal ke dalam sebuah aliran
(stream) sejumlah bilangan biner.
·
Bilangan biner ini kemudian disimpan di dalam memori
dan akan menjadi data raw yang akan diproses.
2. Proses
pengolahan citra (Image Processing)
·
Tahapan berikutnya computer vision akan melibatkan
sejumlah manipulasi utama (initial manipulation) dari data binary tersebut.
·
Image processing membantu peningkatan dan perbaikan
kualitas image, sehingga dapat dianalisa dan di olah lebih jauh secara lebih
efisien.
·
Image processing akan meningkatkan perbandingan sinyal
terhadap noise (signal‐to‐noise ratio = s/n).
·
Sinyal‐sinyal tersebut adalah informasi yang akan
merepresentasikan objek yang ada dalam image.
·
Sedangkan noise adalah segala bentuk interferensi,
kekurangpengaburan, yang terjadi pada sebuah objek.
3. Analisa
data citra (Image Analysis)
·
Image analysis akan mengeksplorasi scene ke dalam
bentuk karateristik utama dari objek melalui suatu proses investigasi.
·
Sebuah program komputer akan mulai melihat melalui
bilangan biner yang merepresentasikan informasi visual untuk mengidentifikasi
fitur‐fitur spesifik dan
karekteristiknya.
karekteristiknya.
·
Lebih khusus lagi program image analysis digunakan
untuk mencari tepi dan batas‐batasan objek dalam image.
·
Sebuah tepian (edge) terbentuk antara objek dan latar
belakangnya atau antara dua objek yang spesifik.
·
Tepi ini akan terdeteksi sebagai akibat dari perbedaan
level brightness pada sisi yang berbeda dengan salah satu batasnya.
4. Proses
pemahaman data citra (Image Understanding)
·
Ini adalah langkah terakhir dalam proses computer
vision, yang mana sprsifik objek dan hubungannya diidentifikasi.
·
Pada bagian ini akan melibatkan kajian tentang
teknik-teknik artificial intelligent.
·
Understanding berkaitan dengan template matching yang
ada dalam sebuah scene.
·
Metoda ini menggunakan program pencarian (search
program) dan teknik penyesuaian pola (pattern matching techniques).
Contoh aplikasi dari Computer Vision
Beberapa aplikasi yang dihasilkan
dari Computer Vision antara lain :
1. Psychology,
AI – exploring representation and computation in natural vision
2. Optical
Character Recognition – text reading
3. Remote
Sensing – land use and environmental monitoring
4. Medical
Image Analysis – measurement and interpretation of many types of images
5. Industrial
Inspection – measurement, fault checking, process control
6. Robotic –
navigation and control
B.
BROWSING
AUDIO DATA
Browsing merupakan aktivitas menjelajahi dunia maya (Internet) untuk mencari informasi yang terkini tanpa batas dan tanpa birokrasi atau dikenal juga dengan istilah surfing internet (berselancar di dunia maya), software yang digunakan dikenal dengan nama web browser. Beberapa contoh web browser adalah Mozilla Firefox, Internet aexplorer, Opera, Chrome, dll.
Audio adalah Bunyi atau suara adalah
kompresi mekanikalatau gelombang longitudinal yang merambat
melalui medium. Medium atau zat perantara ini dapat berupa
zat cair, padat, gas. Jadi, gelombang bunyi dapat merambat
misalnya di dalam air, batu bara, atau udara yang dapat di
tangkap oleh telinga manusia menjadi sebuah gelombang suara. Sedangkan data
adalah catatan atas suatu kumpulan fakta. jadi audio data adalah suatu
data-data atau kumpulan dari suara atau bunyi.
Browsing Audio Data merupakan metode
browsing jaringan yang digunakan untuk browsing video / audio data yang
ditangkap oleh sebuah IP kamera. Sebuah metode browsing jaringan disediakan
untuk browsing video / audio data yang ditembak oleh sebuah IP kamera.
Jaringan video / audio metode
browsing sesuai mencakup langkah-langkah dari :
- · Menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi yang disimpan dalam kamera IP,
- · Transmisi untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server) oleh program aplikasi,
- · Mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server pribadi dan,
- · Compile ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video / audio data yang ditembak oleh kamera IP, di mana server layanan menangkap video / audio data yang ditembak oleh kamera IP melalui Internet.
Browsing audio data tidak semudah browsing dokumen cetak, karena adanya
sifat temporal suara. Ketika melakukan browsing terhadap dokumen, kita dapat
dengan cepat mengalihkan fokus perhatian dengan membaca sepintas isi dari
dokumen tersebut. Kita dapat mengetahui ukuran dan struktur dokumen, dan
menggunakan memori spasial visual untuk mengingat dan mencari spesifik topik.
Namun, ketika browsing suatu rekaman audio, kita harus berulang kali
memainkan dan melompati bagian tertentu, tanpa memainkannya, kita tidak bisa
menyadari suara atau isinya. Kita harus mendengarkan semua stream audio untuk
dapat menangkap semua isinya.
Beberapa bentuk informasi yang dapat dicari (browsed) melalui
internet, yaitu: informasi berupa teks (text/plain, text/html), image
(image/gif, image/jpeg, image/png), video (video/mpeg, video/quicktime), audio
(audio/basic, audio/wav) dan application (application/msword,
application/octet-stream).
Penemuan berkaitan dengan sistem dan metode untuk browsing video / audio
data, lebih khusus ke jaringan video / audio sistem browsing dan metode yang
akan diatur dalam sebuah IP kamera (juga disebut sebagai kamera jaringan) untuk
browsing video / audio data yang ditembak oleh kamera IP.
Sebagai kemajuan teknologi jaringan, semakin banyak diterapkan jaringan
produk yang dibuat-buat terus-menerus. Salah satu yang paling umum diterapkan
jaringan yang dikenal adalah produk kamera IP, yang dapat menampilkan isi
(video / audio data) melalui Internet. Kamera IP biasanya terhubung ke jaringan
melalui router, dan memiliki sebuah IP (Internet Protocol) address setelah
operasi sambungan.
Jaringan video / audio sistem browsing penemuan yang sekarang digunakan
untuk browsing video / audio data yang ditembak oleh sebuah IP kamera. Sistem
penjelajahan termasuk DDNS (Dynamic Domain Name Server), sebuah IP kamera
disimpan dengan kode identifikasi, sebuah layanan server, sebuah komputer lokal
dan setidaknya satu client. Masing-masing item sebelumnya terhubung ke
Internet.
0 komentar: