Pada artikel ini kita akan mempelajari cara mengonfigurasi properti dan hubungan di database Azure Synapse Lake.
pengantar
Dalam artikel saya sebelumnya, Memulai dengan Azure Synapse Lake Database dan Lake Tables, kami mempelajari cara membuat instance Azure Synapse dan membuat Database Lake serta tabel di dalamnya. Kami membuat data di Azure Data Lake Storage dan kemudian membuat struktur data di database Azure Synapse Lake dan mengonfigurasi struktur ini untuk berintegrasi dengan data dan akhirnya berhasil mengakses data ini. Dalam skenario produksi, biasanya ada ratusan tabel yang dapat dimodelkan dengan cara tertentu dengan batasan dan hubungan. Selain itu, hasilnya mungkin perlu dianalisis dengan cara yang lebih grafis daripada hanya data dalam format tabel yang ditampilkan dalam kisi data. Database dan Tabel Azure Synapse Lake menyediakan cara grafis dan intuitif untuk mengonfigurasi batasan tabel, atribut, dan hubungan.
Konfigurasikan database Azure Synapse dan properti tabel
Diasumsikan bahwa seseorang telah mengikuti dua artikel sebelumnya tentang Synapse Azure Lake Database dan membuat instance dan tabel Lake Database di dalamnya. Ini adalah prasyarat mutlak untuk melanjutkan langkah-langkah lainnya dalam latihan ini. Di artikel terakhir, kami selesai membuat tabel Pelanggan yang menunjuk ke file data yang dihosting di Penyimpanan Azure Data Lake. Misalkan kita ingin mengkloning tabel ini karena suatu alasan, biasanya untuk membuat salinan atau arsip tabel yang sama dimana tata letak tabelnya sama, tetapi datanya berbeda. Dalam hal ini, kita dapat mengklik oval tabel pelanggan seperti yang ditunjukkan di bawah ini dan kita akan mendapatkan opsi untuk dengan mudah mensimulasikan tabel ini.
Sekarang tabel sudah ada, kita bisa mulai melihat pengaturan default dan menyesuaikannya sesuai kebutuhan. Klik tabel tersebut dan akan muncul jendela pengaturan seperti gambar di bawah ini. Ini memiliki tiga tab – Umum, Kolom dan Hubungan. Mari kita periksa ketiganya satu per satu. Pada Umum Di tab Properties, kami menemukan opsi untuk mengubah nama tabel, deskripsi, dan folder tampilan di mana tabel terdaftar selama browsing. Kumpulan properti berikutnya di bagian ini terkait dengan penyimpanan. Kami dapat mengonfigurasi tabel untuk mewarisi semua properti seperti layanan tertaut, folder input, dan properti terkait lainnya dari konfigurasi instans database Azure Synapse Lake dengan memilih kotak centang. Mewarisi dari database default.
Properti terkait tabel lainnya yang dapat kita ubah dari bagian ini adalah layanan tautan, folder input atau lokasi file dan format data. Opsi lain seperti Row Header memungkinkan Anda untuk mengonfigurasi beberapa baris data, Data Delimited, Compression, dan Partition tergantung pada jenis data yang dihosting di sumber data.
Tab berikutnya sama kolom Tab di mana kita dapat menemukan semua kolom yang tercantum dalam tabel. Di sinilah kita dapat memodifikasi tata letak tabel. Kita dapat menambahkan batasan seperti kunci utama dengan mencentang kotak yang sesuai di depan setiap nama bidang. Kami juga dapat mengubah tipe data serta panjang atau presisi data dari sini. Kapan saja, kami juga dapat menambah atau menghapus bidang dari tab ini. Untuk menyimpan perubahan ini, perlu untuk mempublikasikan perubahan, jika tidak, perubahan akan dihapus dari ruang kerja.
Misalkan kita ingin menjadikan bidang ID Pelanggan di tabel Pelanggan sebagai kunci utama, sehingga kita dapat mencentang kotak PK dan menghapus centang pada opsi Null dan mempublikasikan perubahan. Saat kita memilih dua atau lebih bidang dengan tipe data yang sama, kita dapat menggunakan opsi menu Convery Type untuk mengonversi kolom secara massal dari satu tipe ke tipe lainnya.
Tab berikutnya dan terakhir ada di bagian pengaturan Hubungan Tab Pada tab ini kita memiliki pilihan untuk mendefinisikan relasi untuk tabel. Hubungan dapat berupa input dan output. Secara sederhana, ini berarti bahwa sebuah tabel dapat memiliki kunci sebagai kunci asing yang mungkin merupakan kunci utama dari tabel lain. Dengan kata lain, relasi di mana tabel adalah tabel anak. Jenis hubungan lain adalah di mana tabel bertindak sebagai tabel utama dan kunci utamanya digunakan sebagai kunci asing di tabel lain. Di sini kita memiliki kemungkinan untuk mendefinisikan kedua jenis hubungan dari tabel berbeda yang ditentukan dalam instance database Azure Synapse Lake. Untuk menguji konfigurasi properti relasi, kita membutuhkan setidaknya satu tabel.
Ikuti langkah-langkah yang kami lakukan sebelumnya untuk mendaftarkan tabel Pelanggan dan mendaftarkan tabel lain menggunakan file data lain yang dihosting di Azure Data Lake Storage. Dalam hal ini, saya telah membuat tabel Alamat yang memiliki ID Pelanggan yang sama seperti pada tabel Pelanggan. Setelah tabel ini terdaftar, maka akan terlihat seperti gambar di bawah ini. Di sini kami sengaja menyimpan nama bidang sebagai C1, C2, dll. untuk mensimulasikan situasi di mana nama bidang mungkin tidak sama dalam dua tabel.
Sekarang, untuk menentukan hubungan untuk tabel alamat yang baru dibuat, pilih tabel ini dan klik item menu Hubungan seperti yang ditunjukkan di bawah ini. Pilih Ke meja Opsi sebagai tabel pelanggan bertindak sebagai tabel induk ke tabel alamat. Setelah memilih opsi ini, baris detail akan muncul seperti yang ditunjukkan di bawah ini.
Di sisi kiri, kami memilih tabel Pelanggan dengan bidang sebagai ID pelanggan dan di sisi kanan, kami memilih tabel Alamat dengan bidang yang sesuai yang memiliki ID Pelanggan, yang merupakan bidang kunci asing.
Hubungan sekarang didefinisikan dan dua tabel sekarang terkait. Kita dapat membuka jendela skrip untuk memeriksa data dalam tabel terkait ini juga. Seperti yang ditunjukkan di bawah ini, di sini kita memiliki kueri SQL yang menggabungkan dua tabel di bidang ID Pelanggan. Klik tombol Run untuk menjalankan query dan hasilnya seperti gambar di bawah ini.
Secara default, data ditampilkan dalam opsi tabular, tetapi ada lebih banyak hal yang dapat kita lakukan dengan data ini juga. Ada opsi untuk mengekspor data ini dalam format seperti CSV dan JSON. Katakanlah kita ingin memeriksa data ini secara grafis. Kami tidak perlu menyalin atau mengekspor data ini ke alat lain untuk membuat bagan dasar menggunakan data ini. Opsi ini tersedia di antarmuka hasil yang sama. Klik pada opsi grafik karena kita dapat menemukan opsi grafik seperti yang ditunjukkan di bawah ini.
Beberapa jenis bagan didukung, dan opsi konfigurasi bagan dapat bervariasi tergantung pada jenis bagan. Dalam hal ini, kami memiliki kueri di mana kami menghitung jumlah pelanggan yang dikelompokkan berdasarkan judul mereka. Data ini menunjukkan distribusi pelanggan berdasarkan karakteristik, dan diagram lingkaran adalah salah satu diagram yang paling sederhana dan paling banyak digunakan untuk menunjukkan distribusi data. Kita hanya perlu memilih jenis bagan sebagai lingkaran dan kategori sebagai judul, dan bagan akan terlihat seperti gambar di bawah ini. Itu juga dapat mengekspor gambar bagan ini dalam format seperti jpeg dan png.
Dengan cara ini, kita dapat memodelkan metadata database dan tabel Azure Synapse Lake dan menjelajahi data secara visual.
Hasil
Dalam artikel ini, kami mempelajari cara menggunakan Visual Modeler untuk mengonfigurasi database Azure Synapse Lake dan atribut serta hubungan tabel dan untuk memeriksa data secara visual dari beberapa tabel.
