Evolusi dari Teori Database per Generasi ~ Aditia Online

Setelah kemajuan teknologi di bidang prosesor, memori komputer, penyimpanan komputer dan jaringan komputer, ukuran, kemampuan, dan kinerja database dan DBMS masing-masing telah tumbuh dalam lipat. Perkembangan teknologi database dapat dibagi menjadi tiga era berdasarkan model data atau struktur: navigasi, SQL / relasional, dan pasca-relasional.
Dua model data navigasi awal utama adalah model hirarkis, dicontohkan oleh IBM sistem IMS, dan model CODASYL (model jaringan), dilaksanakan di sejumlah produk seperti IDMS.
Model relasional, pertama kali diusulkan pada tahun 1970 oleh Edgar F. Codd, berangkat dari tradisi ini dengan menekankan bahwa aplikasi harus mencari data dengan konten, bukan dengan mengikuti link. Model relasional menggunakan set meja buku-gaya, masing-masing digunakan untuk berbagai jenis entitas. Hanya di pertengahan 1980-an itu hardware komputasi menjadi cukup kuat untuk memungkinkan penyebaran macam sistem relasional (DBMS ditambah aplikasi). Pada awal 1990-an, bagaimanapun, sistem relasional mendominasi di semua aplikasi pengolahan data skala besar, dan pada 2014 mereka tetap dominan kecuali di daerah niche. Bahasa database yang dominan, SQL standar untuk model relasional, telah mempengaruhi bahasa database untuk model data lainnya.
Database objek yang dikembangkan pada 1980-an untuk mengatasi ketidaknyamanan objek-relasional ketidakcocokan impedansi, yang menyebabkan coining istilah “pasca-relasional” dan juga pengembangan database objek-relasional hibrida.
Generasi berikutnya dari database pasca-relasional di tahun 2000-an dikenal sebagai database NoSQL, memperkenalkan kunci-nilai yang cepat toko dan database berorientasi dokumen. Sebuah bersaing “generasi berikutnya” yang dikenal sebagai database NewSQL mencoba implementasi baru yang mempertahankan relasional model / SQL sementara bertujuan untuk mencocokkan kinerja tinggi NoSQL dibandingkan dengan DBMS relasional tersedia secara komersial.

1960, DBMS navigasi
Pengenalan database jangka bertepatan dengan ketersediaan penyimpanan langsung akses (disk dan drum) dari pertengahan 1960-an dan seterusnya. Istilah mewakili kontras dengan sistem berbasis tape dari masa lalu, yang memungkinkan penggunaan bersama interaktif daripada batch processing sehari-hari. Kamus Oxford English mengutip 1962 laporan oleh Sistem Development Corporation of California sebagai yang pertama menggunakan istilah “Data-base” dalam pengertian teknis tertentu.

Seperti komputer tumbuh dalam kecepatan dan kemampuan, sejumlah sistem database tujuan umum muncul; pada pertengahan 1960-an sejumlah sistem tersebut telah datang ke dalam penggunaan komersial. Bunga dalam standar mulai tumbuh, dan Charles Bachman, penulis salah satu produk tersebut, Data Store Terpadu (IDS), mendirikan “Database Tugas Kelompok” dalam CODASYL, kelompok yang bertanggung jawab untuk penciptaan dan standarisasi COBOL. Pada tahun 1971 Database Kelompok Tugas disampaikan standar mereka, yang umumnya dikenal sebagai “pendekatan CODASYL”, dan segera sejumlah produk komersial berdasarkan pendekatan ini memasuki pasar.
Pendekatan CODASYL mengandalkan “manual” navigasi set data terkait yang dibentuk menjadi jaringan besar. Aplikasi bisa menemukan catatan oleh salah satu dari tiga metode :

 Penggunaan kunci utama (dikenal sebagai kunci CALC, biasanya dilaksanakan oleh hashing)
 Menjelajahi hubungan (disebut set) dari satu record yang lain
 Memindai semua catatan dalam urutan sekuensial.
Kemudian sistem menambahkan B-Pohon untuk menyediakan jalur akses alternatif. Banyak database CODASYL juga menambahkan bahasa query yang sangat mudah. Namun, dalam penghitungan akhir, CODASYL sangat kompleks dan diperlukan pelatihan dan tenaga untuk menghasilkan aplikasi yang berguna.
IBM juga memiliki DBMS mereka sendiri pada tahun 1968, yang dikenal sebagai Sistem Informasi Manajemen (IMS). IMS adalah pengembangan perangkat lunak yang ditulis untuk program Apollo pada System / 360. IMS secara umum mirip dalam konsep ke CODASYL, tetapi digunakan hirarki yang ketat untuk model yang navigasi data, bukan model jaringan CODASYL itu. Kedua konsep kemudian dikenal sebagai database navigasi karena cara data diakses, dan 1973 Turing Award Presentasi Bachman adalah The Programmer sebagai Navigator. IMS diklasifikasikan sebagai database hierarkis. IDMS dan basis data TOTAL Cincom Sistem ‘diklasifikasikan sebagai database jaringan. IMS tetap digunakan pada 2014.

1970, DBMS relasional
Edgar Codd bekerja di IBM di San Jose, California, di salah satu kantor cabang mereka yang terutama terlibat dalam pengembangan sistem hard disk. Ia tidak senang dengan model navigasi dari pendekatan CODASYL, terutama kurangnya “pencarian” fasilitas. Pada tahun 1970, ia menulis sejumlah makalah yang diuraikan pendekatan baru untuk pembangunan database yang akhirnya memuncak dalam inovatif A Relational Model Data untuk Besar Bank data Bersama.
Dalam tulisan ini, ia menggambarkan sistem baru untuk menyimpan dan bekerja dengan database besar. Alih-alih catatan yang disimpan dalam beberapa jenis daftar link catatan-bentuk bebas seperti dalam CODASYL, ide Codd adalah untuk menggunakan “tabel” catatan panjang tetap, dengan setiap meja yang digunakan untuk berbagai jenis entitas. Sebuah sistem yang terhubung-daftar akan sangat tidak efisien ketika menyimpan “jarang” database mana beberapa data untuk setiap satu record dapat dikosongkan. Model relasional diselesaikan ini dengan memisahkan data menjadi serangkaian tabel dinormalisasi (atau hubungan), dengan elemen opsional yang pindah dari meja utama di mana mereka akan mengambil ruang hanya jika diperlukan. Data dapat bebas dimasukkan, dihapus dan diedit dalam tabel ini, dengan DBMS melakukan perawatan apapun yang diperlukan untuk menyajikan tampilan tabel untuk aplikasi / pengguna.
Dalam model relasional, catatan “terkait” dengan menggunakan tombol virtual tidak disimpan dalam database tetapi didefinisikan sebagai diperlukan antara data yang terdapat dalam catatan.
Model relasional juga memungkinkan isi database berkembang tanpa menulis ulang konstan link dan pointer. Bagian relasional berasal dari entitas referensi entitas lain dalam apa yang dikenal sebagai satu-ke-banyak hubungan, seperti model hierarkis tradisional, dan banyak-ke-banyak, seperti navigasi (jaringan) Model. Dengan demikian, model relasional dapat mengekspresikan kedua model hirarkis dan navigasi, serta model yang tabular asli, memungkinkan untuk pemodelan murni atau gabungan dalam tiga model, seperti aplikasi membutuhkan.
Misalnya, penggunaan umum dari sistem database untuk melacak informasi tentang pengguna, nama mereka, informasi login, berbagai alamat dan nomor telepon. Dalam pendekatan navigasi semua data ini akan ditempatkan di satu catatan, dan barang-barang yang tidak terpakai akan hanya tidak ditempatkan dalam database. Dalam pendekatan relasional, data akan dinormalisasi ke dalam tabel user, tabel alamat dan meja nomor telepon (misalnya). Rekaman akan dibuat dalam tabel ini opsional hanya jika nomor alamat atau telepon benar-benar disediakan.
Menghubungkan informasi kembali bersama-sama adalah kunci untuk sistem ini. Dalam model relasional, beberapa bit informasi yang digunakan sebagai “kunci”, unik mendefinisikan catatan tertentu. Ketika informasi sedang dikumpulkan tentang pengguna, informasi yang tersimpan dalam tabel opsional akan ditemukan dengan mencari kunci ini. Misalnya, jika nama login pengguna unik, alamat dan nomor telepon untuk pengguna yang akan direkam dengan nama login sebagai kunci. Ini sederhana “re-linking” data terkait kembali ke koleksi tunggal adalah sesuatu yang bahasa komputer tradisional tidak dirancang untuk.
Sama seperti pendekatan navigasi akan membutuhkan program loop untuk mengumpulkan catatan, pendekatan relasional akan membutuhkan loop untuk mengumpulkan informasi tentang salah satu catatan. Solusi Codd ke looping yang diperlukan adalah set-bahasa berorientasi, saran yang nantinya akan menelurkan SQL di mana-mana. Menggunakan cabang matematika yang dikenal sebagai tuple kalkulus, ia menunjukkan bahwa sistem tersebut dapat mendukung semua operasi database normal (insert, update dll) serta menyediakan sistem yang sederhana untuk menemukan dan mengembalikan set data dalam satu operasi.
Makalah Codd dijemput oleh dua orang di Berkeley, Eugene Wong dan Michael Stonebraker. Mereka memulai sebuah proyek yang dikenal sebagai INGRES menggunakan dana yang sudah dialokasikan untuk proyek basis data geografis dan programmer mahasiswa untuk menghasilkan kode. Mulai tahun 1973, INGRES disampaikan produk tes pertama yang umumnya siap untuk digunakan secara luas pada tahun 1979. INGRES yang mirip dengan Sistem R dalam berbagai cara, termasuk penggunaan “bahasa” untuk akses data, yang dikenal sebagai QUEL. Seiring waktu, INGRES pindah ke standar SQL yang muncul.
IBM sendiri melakukan satu uji implementasi dari model relasional, PRTV, dan satu produksi, Sistem Bisnis 12, baik sekarang dihentikan. Honeywell menulis MRDS untuk Multics, dan sekarang ada dua implementasi baru: Alphora Dataphor dan Rel. Kebanyakan implementasi DBMS lain biasanya disebut relasional sebenarnya SQL DBMSs.
Pada tahun 1970, University of Michigan memulai pengembangan MICRO Sistem Informasi Manajemen berdasarkan DL Childs ‘Set-teoritik data Model. [14] [15] [16] Micro digunakan untuk mengelola set data yang sangat besar oleh Departemen Tenaga Kerja AS, Badan Perlindungan Lingkungan, dan peneliti dari University of Alberta, Universitas Michigan, dan Wayne State University. Itu berlari pada mainframe IBM komputer menggunakan Terminal Sistem Michigan. Sistem ini tetap diproduksi hingga tahun 1998.
Pendekatan terpadu
Artikel utama: mesin database
Pada 1970-an dan 1980-an usaha dilakukan untuk membangun sistem database dengan hardware dan software yang terintegrasi. Filosofi yang mendasari adalah bahwa integrasi tersebut akan memberikan kinerja yang lebih tinggi dengan biaya lebih rendah. Contoh yang IBM System / 38, korban awal Teradata, dan mesin basis data Britton Lee, Inc..
Pendekatan lain untuk dukungan hardware untuk manajemen database adalah ICL CAFS akselerator, controller hardware disk dengan kemampuan pencarian diprogram. Dalam jangka panjang, upaya ini umumnya berhasil karena mesin database yang khusus tidak bisa mengimbangi pesatnya perkembangan dan kemajuan komputer tujuan umum. Dengan demikian sebagian besar sistem database saat ini adalah sistem perangkat lunak yang berjalan pada perangkat keras untuk keperluan umum, dengan menggunakan tujuan umum penyimpanan data komputer. Namun ide ini masih dikejar untuk aplikasi tertentu dengan beberapa perusahaan seperti Netezza dan Oracle (Exadata).
1970-an, SQL DBMS
IBM mulai bekerja pada sistem prototipe longgar didasarkan pada konsep Codd sebagai Sistem R pada awal tahun 1970-an. Versi pertama sudah siap pada 1974/5, dan bekerja kemudian mulai pada sistem multi-tabel dimana data dapat dibagi sehingga semua data untuk catatan (beberapa di antaranya adalah opsional) tidak harus disimpan dalam tunggal yang besar “sepotong”. Selanjutnya versi multi-user telah diuji oleh pelanggan pada tahun 1978 dan 1979, saat bahasa query standar – SQL telah ditambahkan. Ide Codd yang membangun diri mereka sebagai baik diterapkan dan unggul CODASYL, mendorong IBM untuk mengembangkan versi produksi sejati Sistem R, yang dikenal sebagai SQL / DS, dan, kemudian, Database 2 (DB2).
Larry Ellison Oracle dimulai dari rantai yang berbeda, berdasarkan makalah IBM pada Sistem R, dan mengalahkan IBM untuk pasar saat versi pertama dirilis pada tahun 1978.
Stonebraker pergi untuk menerapkan pelajaran dari INGRES untuk mengembangkan database baru, Postgres, yang sekarang dikenal sebagai PostgreSQL. PostgreSQL sering digunakan untuk misi global aplikasi kritis (.org dan .info nama domain pendaftar menggunakannya sebagai menyimpan data utama mereka, seperti yang dilakukan banyak perusahaan besar dan lembaga keuangan).
Di Swedia, kertas Codd juga membaca dan Mimer SQL dikembangkan dari pertengahan 1970-an di Universitas Uppsala. Pada tahun 1984, proyek ini dikonsolidasikan ke dalam suatu perusahaan independen. Pada awal 1980-an, Mimer memperkenalkan transaksi penanganan untuk ketahanan tinggi dalam aplikasi, sebuah ide yang kemudian dilaksanakan pada kebanyakan DBMS lainnya.
Model data lain, model entitas-hubungan, muncul pada tahun 1976 dan mendapatkan popularitas untuk desain database karena menekankan deskripsi yang lebih akrab dari model relasional sebelumnya. Kemudian, entitas-hubungan konstruksi yang dipasang sebagai konstruksi pemodelan data untuk model relasional, dan perbedaan antara keduanya telah menjadi tidak relevan.

1980, pada desktop

Tahun 1980-an diantar dalam usia komputer desktop. Komputer baru diberdayakan pengguna mereka dengan spreadsheet seperti Lotus 1-2-3 dan software database seperti dBASE. Produk dBASE adalah ringan dan mudah untuk setiap pengguna komputer untuk memahami keluar dari kotak. C. Wayne Ratliff pencipta dBASE menyatakan: “dBASE berbeda dari program-program seperti BASIC, C, FORTRAN, COBOL dan dalam banyak pekerjaan kotor sudah dilakukan Manipulasi data dilakukan dengan dBASE bukan oleh pengguna. , sehingga pengguna dapat berkonsentrasi pada apa yang dia lakukan, daripada harus main-main dengan rincian kotor membuka, membaca, dan menutup file, dan mengelola alokasi ruang. dBASE adalah salah satu software penjualan atas di 1980 dan awal 1990-an.

1980, object-oriented

Tahun 1980-an, bersama dengan kenaikan dalam pemrograman berorientasi objek, melihat pertumbuhan dalam bagaimana data dalam berbagai database ditangani. Programmer dan desainer mulai memperlakukan data dalam database mereka sebagai objek. Artinya bahwa jika data seseorang berada dalam database, atribut orang itu, seperti alamat, nomor telepon, dan usia, kini dianggap milik orang itu bukannya data yang asing. Hal ini memungkinkan untuk hubungan antara data menjadi hubungan ke objek dan atribut mereka dan tidak untuk bidang individu. Istilah “objek-relasional ketidakcocokan impedansi” menggambarkan ketidaknyamanan menerjemahkan antara objek diprogram dan tabel database. Obyek database dan database object-relasional berusaha untuk memecahkan masalah ini dengan menyediakan bahasa berorientasi objek (kadang-kadang sebagai ekstensi untuk SQL) bahwa programmer dapat digunakan sebagai alternatif untuk SQL murni relasional. Di sisi pemrograman, perpustakaan dikenal sebagai pemetaan objek relasional (ORMS) mencoba untuk memecahkan masalah yang sama.

2000, NoSQL dan NewSQL
Artikel utama: NoSQL dan NewSQL. Generasi berikutnya dari database pasca-relasional di tahun 2000-an dikenal sebagai database NoSQL, termasuk kunci-nilai yang cepat toko dan database berorientasi dokumen. Database XML adalah jenis database berorientasi dokumen terstruktur yang memungkinkan query berdasarkan atribut dokumen XML. Database XML sebagian besar digunakan dalam manajemen basis data perusahaan, di mana XML digunakan sebagai standar interoperabilitas data yang mesin-ke-mesin. Database XML sebagian besar sistem perangkat lunak komersial, yang mencakup Clusterpoint, MarkLogic dan Oracle XML DB. Database NoSQL sering sangat cepat, tidak memerlukan skema tabel tetap, menghindari bergabung dengan operasi dengan menyimpan data denormalized, dan dirancang untuk skala horizontal. Sistem NoSQL paling populer termasuk MongoDB, Couchbase, Riak, memcached, Redis, CouchDB, Hazelcast, Apache Cassandra dan HBase, yang semua produk perangkat lunak open-source.
Dalam beberapa tahun terakhir ada permintaan yang tinggi untuk database terdistribusi secara besar-besaran dengan toleransi partisi yang tinggi tetapi menurut teorema CAP adalah mustahil untuk sistem terdistribusi untuk secara bersamaan memberikan konsistensi, ketersediaan dan toleransi partisi jaminan. Sebuah sistem terdistribusi dapat memenuhi dua dari jaminan tersebut pada saat yang sama, tetapi tidak semua tiga. Untuk itu banyak database NoSQL menggunakan apa yang disebut konsistensi akhirnya untuk menyediakan ketersediaan dan toleransi partisi jaminan dengan penurunan tingkat konsistensi data.
NewSQL adalah kelas database relasional modern yang bertujuan untuk memberikan performa yang sama sistem NoSQL untuk proses transaksi online (baca-tulis) beban kerja saat masih menggunakan SQL dan mempertahankan jaminan ACID sistem database tradisional. Database tersebut termasuk Scalebase, Clustrix, EnterpriseDB, MemSQL, NuoDB dan VoltDB.

Penelitian
Teknologi database telah menjadi topik penelitian aktif sejak tahun 1960-an, baik dalam dunia akademis dan dalam kelompok penelitian dan pengembangan perusahaan (misalnya IBM Research). Kegiatan penelitian meliputi teori dan pengembangan prototipe. Topik penelitian Terkemuka telah memasukkan model, konsep transaksi atom dan terkait teknik concurrency control, bahasa query dan metode optimasi query, RAID, dan banyak lagi.
Daerah penelitian database memiliki beberapa jurnal akademik khusus (misalnya, Transaksi ACM pada Sistem-TODS Database, Data dan Pengetahuan Teknik-DKE) dan konferensi tahunan (misalnya, ACM SIGMOD, ACM PODS, VLDB, IEEE ICDE).

Untuk mengunduh semua artikel ini click link di bawah ini :

Aditia Online

Kamis, 22 Juni 2017

Evolusi dari Teori Database per Generasi

0 komentar:

Posting Komentar

Popular Posts

Categories

Website Me

Blog Archive

Mengenai Saya