Laman

Selasa, 04 Desember 2012

Pemrosesan filedan konsep menajemen data


Terminology-terminologi yang digunakan tekhnologi database adalah :
FIELD, UNSUR DATA, ATRIBUT dan ELEMEN-ELEMEN
Istilah-istilah field, unsure data, atribut, dan elemen digunakan secara bergantian untuk menyebutkan blok data terkecil yang disimpan dan digunakan dalam system informasi, jika hanya beberapa bagian field yang cocok bagi pemakai, maka foeld harus dipisahkan menjadi beberapa unsure data yang terpisah. Fielddapat terdiri atas karakter tunggal atau nomor tunggal, atau terdiri dari beberapa karakter atau nomor.
Contoh-contoh field adalah :
·                     Nama pelanggan
·                     Nomor tunjangan sosial karyawan
·                     Nomor pesanan pembelian
Field biasanya secara logis berkaitan dengan field lainnya, Pengelompokkan logis atas field disebut Catatan ( Record ). Catatan merupakan kelompok unsure-unsur data yang memuat beberapa entitas seperti ; Karyawan, Pelanggan, Pemasok, Faktur, dll.
Okurensi data
struktur catatan memiliki okurensi yang disebut instances. Okurensi catatan adalah himpunan spesifik nilai-nilai data untuk catatan.
Panjang catatan-tetap dan variabel
catatan dengan panjang-tetap lebih mudah untuk dimanupulasi dalam aplikasi-aplikasi komputer dibandingkan catatan dengan panjang-variabel karena ukuran catatan dengan panjang-tetap distandarkan. Sebagian besar catatan yang disimpan dalam direct access storage devices (DASDs) adalah catatan dengan panjang-tetap.
Catatan panjang variable :
1.      Akhir dari catetan di indikasikan dengan simbol.
2.      Secara efisien memanfaatkan ruang penyimpangan yang tersedia,tetapi memanipulasi catetan lebih sulit.
3.      Salah satu pendekatannya adalah catetan penjejak. Catatan penjejak adalah perluasan dari catetan master.
Kunci catatan dan urutan file
kunci catatan merupakan unsur data atau kombinasi unsur data yang secara unik mengidentifikasikan catatan tertentu dalam file. Kunci primer adalah field yang digunakan untuk menyotir catatan-catatan dalam file. Kunci sekunder adalah digunakan untuk menentukan posisi relatif antar kumpulan catatan manakal kunci primer memiliki nilai yang sama untuk setiap catatan-catatan dalan kumpulan. Kunci-kunci adalah penting karena diperlukan untuk memproses dan melokasikan catatan - catatan dalam file.
Teknologi Database
Pengembangan dalam teknologi untuk melakukan masukan data ke komputer secara umum berperan dalam perkembangan database secara pesat.
Dengan sistem manajemen databes , data disimpan dalam format standar dengan menggunakan bahasa definisi data - data definition language, dimanipulasi dan dimutakhirkan dengan menggunakan bahasa manipulasi database - database manipulation language, dan dipanggil dengan menggunakan bahasa kueri database-database.
Layanan informasi online
Banyak perusahaan mengumpulkan informasi dari layangan on-line yang harus dikaitkan secara sistematis dengan sistem informasi mereka.
Expert system
sistem ahli membantu pengambilan keputusan tingkat tinggi dan telah sukses diterapkan dalam beberapa area.
Pemrograman berorientasi - objek
Meliputi pendefinisian objek-objek dari daftar atau kumpulan informasi yang rumit. Hal menjadi objek : daftar komponen-komponen persediaan, kelompok pelanggan, atau bahkan kumpulan foto.
Sistem hiperteks
Memungkinkan para pemakai untuk mengambil database dengan cara random melalui pemilihan kata-kata kunci.
Sistem database intelijen
Sistem ini merefleksikan kecenderungan penggabungan seluruh teknologi-teknologi terbaru, termasuk yang paling muktahir, ke dalam satu sistem database.
·                     Evolusi Teknologi Database
Periode
Kejadian
Teknik Database Yang Berkaitan
1960-an
Lingkungan mainframe
Sistem manajemen database
Layanan informasi on-line
Sistem file
Manajemen database
Manajemen teks
1970-an
Expert systems
Pemrograman berorientasi-obyek
Inferensi dan Deduksi
Inheritansi dan Abstraksi
1980-an
Sistem Hiperteks
Asosiasi
1990-an
System database intelijen
Kombinasi teknik-teknik
·        Penjelasan  tiga tingkatan arsitektur yang ada dalam database
1.     Arsitektur tingkat konseptual merupakan kumpulan beragam elemen informasi yang akan digunakan untuk tujuan-tujuan yang telah dipilih.
2.     Arsitektur tingkat logis merupakan pengimplementasian data base yang didefinisikan pada tingkat konseptual, harus ditetapkan file dan catatan-catatan spesifik yang membentuk struktur data logis.
3.     Arsitektur tingkat fisik berkaitan dengan tehnik-tehnik implementasi dan isu-isu khusus yang berhubungan dengan metode-metode pengaksesan data.
Rincian arsitektur database :
1.     Tingkat konseptual
·      Isi database, Penggunaan database, Laporan yang diinginkan, Informasi yang diketahui
2.     Tingkat logis
Struktur data logis :
·      Pohon ( secara hirarki ), jaringan, dan hubungan ( relasional )
3.     Tingkat fisikal
Metode-metode Akses :
·      Sekuensial, sekuensial terindeks, langsung.
·       Penjelasan teknik-teknik organisasi file
Teknik-teknik organisasi file
Saat terbaik
Keterbatasan
Sekuensial
Rasio aktivitas tinggi,seperti dalam pemrosesan batch
Tidak memungkinkan untuk mengakses catatan tunggal secara cepat
Terindeks
Rasio aktivitas rendah,ukuran file dari moderat sampai tinggi
Pemutakhiran file membutuhkan pemuktahiran indeks-indeks 
Sekuensial-terindeks
File harus diproses dengan pola pemerosesan batch (rasio aktivitas tinggi) non batch (rasio aktivitas rendah)
Sama dengan sekuensial dan terindeks
Langsung
Rasio aktivitas rendah, file berukuran besar,struktur jaringan,dan struktur pohon  
Memerlukan kunci-kunci untuk menempatkan catatan-catatan
Sistem manajemen database dan arsitekturnya:
1. Arsitektur tingkat konseptual : mencakup pendefinisian terminologi-terminologi umum dalam database dan kebutuhan penggunaan data.meliputi :
a)     Isi database
b)     Penggunaan database
c)      Laporan yang diinginkan
d)     Informasi yang ingin diketahui
2.arsitektur tingkat logis : mencakup pendefinisian struktur data logis, yang dapat dilakukan dengan model hirarkis, jaringan atau relasional. Meliputi :
a)     Pohon
b)     Jaringan
c)      Hubungan (rasional)
3.arsistektur tingkat fisik : mencakup pendefinisian metode-metode akses-file, baik yang sekuensial, terindeks atau langsung. Meliputi :
a)     Sekuensial
b)     Sejuensial terindeks
c)      Langsung
3 Metode dalam pembahasan tingkat fisik arsitektur database :
1.      File terakses secara sekuensial, yaitu catatan – catatan hanya dapat diakses dalam sekuens yang telah ditentukan sebelumnya. Sekuens yang telah ditentukan umumnya merupakan hasil catatan yang telah disortir dalam beberapa kunci catatan. Organisasi file sekuensial bukan merupakan alat sortir data yang bermanfaat jika hanya terdapat sedikit saja catatan yang akan diakses dalam file yang memuat banyak catatan, karena akan menimbulkan pelambatan dalam unit penyimpanan disk. File sekuensial bermanfaat dalam pemrosesan batch, yang secara normal mengakses seluruh catatan dalam file. Pemrosesan batch umumnya meliputi penyortiran dan pemrosesan seluruh catatan dalam file transaksi dan file master.
2.      File terindekssetiap atribut dapat diekstrak dari catatan dalam file utama (primer) dan digunakan untuk membuat file baru yang bertujuan menyediakan indeks untuk file asli. Proses ini diperhitungkan akan lebih cepat dibandingkan pencarian secara sekuensial setiap catatan dalam file, khususnya jika keseluruhan indeks dapat dimuat dalam memori primer sebelum  dilakukan pencarian. Kecepatan pencarian dalam memori primer tergantung pada pencarian dalam disk. File dikatakan terinveksi secara penuh jika ada indeks untuk seluruh field nya. Waktu pemrosesan dibutuhkan  untuk menbagi file terinveksi penuh, karena indeks – indeks harus dimutakhirkan jika catatan – catatan ditambahkan, dihapuskan atau dimodifikasikan.
File sekuensial – terindeks adalah file sekuensial yang tersimpan dalam DASD dan di indeks serta disortir secara fisik dalam field yang sama. File – file tersebut umumnya berhubungan dengan file ISAM, dimana berlaku sebagai kontraksi metode akses sekuensial – terindeks. Struktur ISAM mencakup 3 area yang berbeda :
a.       Indeks, merupakan peta yang menghubungkan field kunci catatan dengan alamat – alamat yang berkaitan di area utama.
b.      Area utama, merupakan bagian dari disk dimana catatan – catatan actual ditulis.
c.       Area tambahan, merupakan bagian terpisah dari disk yang dialokasikan bagi file untuk memuat tambahan yang dibuat, tanpa melakukan pemrosesan ekstensif terhadap file awal.
3.      File terakses secara langsung, memungkinkan catatan – catatan individual dapat dipanggil secara cepat tanpa menggunakan indeks. Ini dapat dilakukan dengan menghubungkan setiap catatan dengan lokasi penyimpanan yang memiliki kaitan dengan nilai – nilai kunci catatan yang bersangkutan. Oleh karena itu, dengan metode akses – langsung, satu – satunya hal yang dibutuhkan untuk menempatkan catatan adalah nilai kuncinya. Salah satu metode yang digunakan untuk menyimpan dan menempatkan catatan – catatan dalam file akses – langsung, yaitu dengan membuat field kunci catatan yang bersangkutan berhubungan langsung skema kode yang digunakan oleh computer untuk mengidentifikasikan alamat fisik dalam DASD. Pada kenyataannya, dalam pemutakhiran file akses – langsung, tidak ada keuntungannya untuk membuat batch dan menyortir transaksi – transaksi. Keuntungannya adalah kecepatan akses ke catatan – catatan individual. Selain itu, organisasi akses – langsung memungkinkan pemutakhiran secara simultan atas beberapa file yang berkaitan.
Hubungan ekonomik antar teknik – teknik organisasi file
Tabel ini akan mengikhtisarkan kapan masing – masing teknik organisasi file digunakan.
Teknik – teknik
Saat Terbaik
Keterbatasan
Sekuensial
Rasio aktifitas tinggi, seperti dalam pemrosesan batch
Tidak memungkinkan untuk mengakses catatan tunggal secara tepat
Terindeks
Rasio aktifitas rendah, ukuran file dari moderat sampai tinggi
Pemutakhiran file membutuhkan pemutakhiran indeks - indeks
Sekuensial – Terindeks
File harus diproses dengan pola pemrosesan batch (rasio aktifitas tinggi ) dan nonbatch ( rasio aktifitas rendah )
Sama dengan sekuensial dan terindeks
Langsung
Rasio aktifitas rendah, file berukuran besar, struktur jaringan, dan struktur pohon
Memerlukan kunci – kunci untuk menempatkan catatan – catatan
Organisasi sekuensial merupakan pemrosesan file yang mempunyai pendekatan biaya tetap, sedangkan organisasi akses – langsung menggunakan pendekatan biaya variable. Dalam akses – langsung, setiap catatan diproses memiliki biaya yang hampir sama, terlepas dari jumlah catatan yang diproses. Untuk aktifitas tinggi, teknik ini relative mahal dibandingkan pemrosesan sekuensial. Dalam pemrosesan sekuensial, biaya total sebagian besar adalah tetap (pemuatan dan penyampaian ke seluruh file) sehingga jika makin banyak transaksi yang diproses, biaya per transaksi akan menurun secara drastis. Pertimbangan ekonomis lainnnya menyangkut waktu tanggap. Waktu tanggap adalah panjangnya waktu yang dibutuhkan system untuk menyelesaikan operasi, seperti misalnya kueri. Jika waktu tanggap yang panjang dapat diterima, kueri umumnya dapat diperoleh dari hasil sampingan posting atas faktur ke file piutang dagang. Kebutuhan waktu tanggap yang lebih panjang dapat dilakukan dengan pemrosesan sekuensial terhadap file. Waktu tanggap juga dipengaruhi oleh kemampuan perangkat keras.
Arsitektur fisik, perangkat keras, dan waktu tanggap
Waktu tanggap dapat menjadi masalah utama untuk database besar yang melakukan akses ratusan, atau bahkan ribuan pemakai dalam waktu yang sama. Dari sisi perangkat keras, waktu tanggap dipengaruhi oleh waktu akses fisik. Ini adalah waktu yang dibutuhkan CPU untuk melakukan pemanggilan blok tunggal data dari disk, yang disebut waktu akses disk. Factor lain yang dapat mempengaruhi waktu tanggap adalah bagaimana catatan data secara fisik didistribusikan dalam disk. Dalam hard disk, data dalam trek atau silinder yang sama dapat diakses tanpa memindahkan alat baca – tulis. Ini berarti dalam beberapa kasus, memungkinkan untuk mempercepat aplikasi database dengan menyimpan catatan file data tertentu secara berurutan dalam satu atau lebih silinder disk. Kebutuhan menyimpan file secara berurutan bergantung pada arsitektur fisik database dan metode akses – file yang digunakannya. Jika database menggunakan metode sekuensial, maka secara fisik akan menempatkan catatan dalam disk, berurutan satu sama lain. Tetapi, metode akses – terindeks, menempatkan indeks – indeks dalam tempat yang penyimpanan yang berurutan, karena file ini seringkali dibaca secara sekuensial untuk keseluruhannya. Kadang – kadang diperlukan pengelompokkan proses seluruh catatan dalam file – terindeks dan dalam kasus tersebut diperlukan tempat penyimpanan berurutan untuk file utama. Untuk metode akses – langsung, penyimpanan catatan – catatan berurutan satu sama lain tidak akan memperbaiki waktu tanggap. Pada kenyataannya, tempat penyimpanan berurutan hampir tidak mungkin dilakukan melihat hakekat pendekatan metode ini.
SISTEM MANAJEMEN DATABASE DAN DATABASE DALAM PRAKTIK
System manajemen database ialah program computer yang memungkinkan pemakai untuk membuat dan memutakhirkan file, memilih dan memanggil data, dan untuk menghasilkan beragam keluaran dan laporan. System manajemen database mencakup 3 atribut untuk pengelolaan dan pengorganisasian :
1.      Bahasa deskripsi data (DDL)
Memungkinkan administrator database untuk mendefinisikan struktur logika database, yang disebut skema. Skema mencakup :
a. nama elemen data
b. jenis data (numeric, alphabet data, dll) dan nomor posisi decimal jika elemen data numeric.
c. jumlah posisi (misalnya 9 posisi untuk nomor jaminan social)
DDL juga digunakan untuk mendefinisikan subskema, yang merupakan database yang dapat dilihat pemakai individual. DDL dapat digunakan untuk membuat, memdifikasi, dan menghapus tabel – tabel dalam lingkup relasional.
2.      Bahasa manipulasi data (DML)
DML mencakup perintah – perintah untuk pemutakhiran, pengeditan, manipulasi dan ekstraksi data. Dalam banyak kasus, pemakai tidak perlu menggunakan DML, tetapi program aplikasi (misalnya, program penggajian atau system akuntansi interaktif) secara otomatis menghasilkan pernyataan DML untuk memenuhi kebutuhan para pemakai.
3.      Bahasa kueri data (DQL)
DQL adalah bahasa yang mudah digunakan atau penghubung yang memungkinkan pemakai untuk meminta informasi dari database. Terdapat pemghubung bahasa alami yang memungkinkan para pemakai untuk meminta informasi dengan menggunakan bahasa sehari – hari. Sistem tersebut dapat mengenali beragam gaya bahasa permintaan, dan jika pemakai menyampaikan permohonan yang tidak lengkap, system akan menyampaikan pertanyaan seperlunya untuk memastikan masalahnya.
Sistem manajemen database memadukan, menstandarisasikan dan menyediakan pengamanan bagi berbagai aplikasi – aplikasi akuntansi. Meskipun memelihara file independen adalah hal yang mudah, tetapi ada beberapa kekurangannya :
a.       Unsur data yang sama digunakan untuk beberapa aplikasi yang berbeda; dalam file independen, unsur data harus dimasukkan dalam masing – masing file aplikasi.
b.      File harus didefinisikan dalam awal proses implementasi system prosedur – prosedur memiliki keterbatasan lebih karena struktur file yang ada dibandingkan karena perubahan kebutuhan aplikasi.
c.       Independensi diantara file seringkali menyebabkan terjadinya struktur – struktur yang berbeda untuk data yang sama, juga akan terjadi, system kode yang berbeda, abreviasi (penyingkatan) yang berbeda, dan panjang field yang berbeda.
Disamping masalah manajemen data dan penyimpanan yang telah dibahas, setiap file independen memerlukan intruksi – intruksi pemrosesan dan pemeliharaan sendiri, jika isi dan struktur file distandarisasikan.
Independensi data, pemecahan untuk masalah – masalah pemeliharaan file independen terletak pada pemisahan penanganan data secara fisik dengan penggunaan logisnya. Ini memerlukan 2 perubahan mendasar, yaitu :
a.       Penyimpanan data terintegrasi dalam suatu database tunggal
b.      Seluruh akses ke himpunan file (database) adalah melalui system perangkat lunak tunggal yang dirancang untuk mengelola aspek fisik penanganan dan penyimpanan data
Keamanan, kemampuan umumnya dalam menerapkan kode – kode keamanan ke unsure – unsure dan atribut – atribut pemrosesannya.
Dokumentasi dan administrasi database, kamus database digunakan untuk mensentralisasikan, mendokumentasikan, mengontrol dan mengkoordinasikan penggunaan data dalam organisasi. Tujuan utama kamus data adalah mengeliminasi atau paling tidak mengontrol ketidakkonsistenan pemanfaatan hasil pemrosesan alias dan untuk mengeliminasi kesia – siaan data. Alias muncul jika pemakai – pemakai yang berbeda memanggil field yang sama dengan nama lain. Administrasi database bertanggungjawab untuk mengatasi ketidaksesuaian dan mengkoordinasikan dan mengkomunikasikan masalah – masalah yang terjadi dalam kelompok – kelompok pemakai database. Tugas utama administrator database ialah menetapkan standar konvensi, dan dokumentasi sumber – sumber data. Ini adalah contoh format kamus data.
Unsur – unsur dalam okurensi kamus data
Spesifikasi
Ø  Nama
Ø    Definisi
Ø    Alias – alias
Karakteristik
Ø    Ukuran
Ø    Nilai – nilai rentang
Ø   Encoding
Ø   Pengeditan data
Utilisasi
Ø   Pemilik
Ø  Dimana digunakan
Ø  Kode keamanan
Ø  Pemutakhiran terakhir

Tidak ada komentar:

Posting Komentar