Nội dung chính
Ngôn ngữ định nghĩa dữ liệu thực chất là cụm từ viết tắt của DDL trong môi trường của SQL thì ngôn ngữ mô tả dữ liệu là một cú pháp có thể tạo và sửa đổi các đối tượng cơ sở dữ liệu như bảng, chỉ mục và người dùng.
Các câu lệnh DDL giống như ngôn ngữ lập trình máy tính để xác định cấu trúc và lược đồ cơ sở dữ liệu chẳng hạn như một câu lệnh DDL bao gồm CREATE, ALTER và DROP. Trong chuyên mục bài viết ngày hôm nay, Làm Web xin được chia sẻ những thông tin liên quan đến ngôn ngữ định nghĩa cơ sở dữ liệu những người đang quan tâm đến vấn đề này.
Ngôn ngữ định nghĩa dữ liệu thực chất là gì ?
Ngôn ngữ định nghĩa dữ liệu lần đầu tiên được giới thiệu có liên quan đến mô hình dữ liệu Codasyl. Trong đó lược đồ của cơ sở dữ liệu được viết bằng cú pháp ngôn ngữ mô tả các bản ghi, lĩnh vực và tập hợp mô hình dữ liệu người dùng.
Sau đó thì ngôn ngữ định nghĩa dữ liệu được sử dụng để chuyển một tập hợp con của những ngôn ngữ truy vấn có cấu trúc SQL để khai báo bảng, cột, kiểu dữ liệu và cách ràng buộc khác.
SQL-92 đã giới thiệu một ngôn ngữ thao tác lược đồ và các bảng thông tin để truy vấn các lược đồ này gọi chung là SQL/ Schemata trong SQL: 2003. Thuật ngữ DDL cũng được sử dụng theo nghĩa chung để chỉ bất kỳ ngôn ngữ chính thức nào mô tả dữ liệu hoặc cấu trúc thông tin.
Khái niệm ngôn ngữ truy vấn có cấu trúc SQL
Ngôn ngữ mô tả dữ liệu sử dụng cú pháp khai báo để xác định cột và kiểu dữ liệu. Tuy nhiên ngôn ngữ truy vấn có cấu trúc SQL sử dụng một tập hợp các động từ mệnh lệnh có tác dụng sửa đổi lược đồ cơ sở dữ liệu bằng cách thêm, thay đổi hoặc xóa các định nghĩa trên bảng hoặc các phần tử khác.
Các câu lệnh này có thể được trộn lẫn các câu lệnh SQL để cho DDL không còn là một ngôn ngữ riêng biệt.
CREATE
Lệnh được sử dụng để thiết lập cơ sở dữ liệu bảng chỉ mục hoặc các lưu trữ mới. Câu lệnh CREATE trong SQL tạo một thành phần trong hệ quản trị cơ sở dữ liệu quan hệ RBDMS. Trong việc mô tả SQL 92 bao gồm các thành phần là lược đồ, bảng, dạng xem, tên miền, bộ ký tự, đối chiếu, bản dịch và xác nhận.
Người dùng có thể triển khai mở rộng cú pháp để cho phép tạo các phần tử bổ sung chẳng hạn như chỉ mục và hồ sơ người dùng. Một số hệ thống như là PostgreSQL và SQL Server cho phép CREATE và một số lệnh DDL khác bên trong giao dịch cơ sở dữ liệu có thể được khôi phục.
CREATE TABLE
Một lệnh CREATE được sử dụng là lệnh CREATE TABLE có dạng điển hình là :
Tạo bảng [tên bảng]([định nghĩa cột]) [thông số bảng]
Trong đó định nghĩa cột là một danh sách được phân tách bằng dấu phẩy bao gồm :
Định nghĩa cột : [tên cột] [kiểu dữ liệu] {NULL | NOT NULL} {tùy chọn cột}
Định nghĩa khóa chính: PRIMARY KEY ([danh sách cột được phân tách bằng dấu phẩy])
Ràng buộc: {CONSTRAINT} [định nghĩa ràng buộc]
Chức năng cụ thể của RDBMS
Một câu lệnh ví dụ để tạo một bảng có tên nhân viên với một vài cột là:
TẠO nhân viên BẢNG (
id INTEGER PRIMARY KEY,
first_name VARCHAR (50) không rỗng,
last_name VARCHAR (75) không rỗng,
mid_name VARCHAR (50) không rỗng,
dateofbirth DATE không rỗng);
Một số dạng CREATE TABLE DDL có thể kết hợp các cấu trúc giống như DML (ngôn ngữ thao tác dữ liệu), chẳng hạn như cú pháp CREATE TABLE AS SELECT (CTaS) của SQL.
DROP
Câu lệnh DROP hủy một cơ sở dữ liệu bảng, chỉ mục hoặc dạng xem hiện có. Trong SQL lệnh DROP loại bỏ một thành phần khỏi hệ thống quản lý cơ sở dữ liệu quan hệ. Các đối tượng bị loại bỏ phụ thuộc vào cơ sở dữ liệu quan hệ RBDMS nào đang được sử dụng. Đa phần các hỗ trợ loại bỏ bảng người dùng và cơ sở dữ liệu.
Một số hệ thống như PostgreSQL cho phép DROP và các lệnh DDL khác xảy ra bên trong một giao dịch và có thể khôi phục lại. Cách sử dụng điển hình là :
DROP tên đối tượng kiểu đối tượng.
Khi người dùng muốn sử dụng lệnh DROP để hủy bỏ một bạn có tên là nhân viên thì cấu trúc là “Nhân viên DROP TABLE”.
Câu lệnh DROP khác với câu lệnh DELETE hay TRUNCATE trong đó hai lệnh này không tự xóa bảng. Câu lệnh DELETE có thể xóa một số hoặc tất cả dữ liệu khỏi bảng mà vẫn để bảng đó trong cơ sở dữ liệu con lệnh rock Xóa bỏ toàn bộ dữ liệu và bảng khỏi cơ sở dữ liệu.
ALTER
Câu lệnh này có thể sửa đổi một số đối tượng trong cơ sở dữ liệu hiện có. Một câu lệnh ALTER trong SQL thay đổi các thuộc tính của một đối tượng bên trong hệ quản trị cơ sở dữ liệu quan hệ và các đối tượng thay đổi phụ thuộc vào RBDMS đang được sử dụng.
Công thức tiêu biểu của câu lệnh này là : ALTER đối tượng kiểu đối tượng tham số tên đối tượng.
Chẳng hạn như lệnh để thêm sau đó loại bỏ một cột có tên là bong bóng cho các bảng hiện có tên là : ALTER TABLE thêm INTEGER hay ALTER TABLE thêm DROP COLUMN.
TRUNCATE
Một loại ngôn ngữ định nghĩa dữ liệu ddal khác trong SQL sử dụng để xác định mối quan hệ toàn vẹn tham chiếu thường được triển khai dưới dạng thẻ khóa chính và khóa ngoại trong một số cột bảng. Hai câu lệnh này có thể bao gồm trong một lệnh CREATE TABLE hoặc ALTER TABLE.
Người dùng có thể sử dụng câu lệnh TRUNCATE để xóa tất cả dữ liệu khỏi bảng nhanh hơn lệnh DELETE.
Công thức tiêu biểu của lệnh TRUNCATE là TRUNCATE TABLE tên_bảng.
Giới thiệu 6 ngôn ngữ lập trình phổ biến nhất hiện nay
Đây là một trong những ngôn ngữ của dân chuyên ngành IT chuyên sử dụng để thiết kế trang web bằng chính cái ngôn ngữ của định nghĩa dữ liệu.
Python
Là ngôn ngữ lập trình hướng tới đối tượng bậc cao được sử dụng để phát triển website và nhiều ứng dụng khác. Người dùng có thể tìm hiểu về ngôn ngữ lập trình Python khi lần đầu tiếp xúc với việc lập trình ngôn ngữ trên máy tính.
Python là ngôn ngữ lập trình hướng đối tượng có hiệu quả cao nhờ cấu trúc dữ liệu mạnh mẽ và cách tiếp cận đơn giản. Cấu trúc lệnh của ngôn ngữ Python rất rõ ràng dễ hiểu đây là một ngôn ngữ lý tưởng để viết Script và phát triển ứng dụng trong nhiều lĩnh vực và nền tảng.
Ngôn ngữ lập trình R
Đây là một công cụ dành cho học máy, thống kê là phân tích dữ liệu Vì vậy đối với các nhà thống kê thì nó rất là phổ biến Đây là một ngôn ngữ dùng để phân tích dữ liệu và thống kê. Nhưng ngôn ngữ R không phải là ngôn ngữ lập trình có mục đích chung.
Cho nên người ta chỉ sử dụng ngôn ngữ R để lập trình thống kê với kho lưu trữ hơn 10.000 gói nguồn mở của SRAN. Ngôn ngữ lập trình thống kê R có thể xử lý một số tuyến tính phức tạp phân tích thống kê và các mạng thần kinh.
Để gia tăng kết nối tự nhiên thì người ta còn cung cấp với tích hợp RMyQuery giữa ngôn ngữ R với MySQL. Vì vậy mà ngôn ngữ R trở thành ngôn ngữ lý tưởng của các nhà khoa học dữ liệu.
SQL
Bất kỳ nhà khoa học dữ liệu nào cũng đều biết đến SQL là ngôn ngữ truy vấn dữ liệu từ các nguồn dữ liệu có tổ chức. Người ta sử dụng SQL để truy cập truy vấn và thao tác cơ sở dữ liệu. Ngôn ngữ SQL là tiêu chuẩn cho hệ cơ sở dữ liệu quan hệ RBDMS. Hệ thống quản lý cơ sở dữ liệu đều sử dụng SQL làm ngôn ngữ cơ sở dữ liệu chuẩn là : MySQL, MS Access, Oracle, Sybase, Informix, Postgres và SQL Server.
Ngôn ngữ lập trình Scala
Đây là một ngôn ngữ mở rộng của ngôn ngữ lập trình Java hoạt động trên JVM. Ngôn ngữ lập trình có mục đích chung sở hữu tính năng công nghệ hướng đối tượng và là một ngôn ngữ lập trình chức năng.
Việc kết hợp sử dụng ngôn ngữ Scala với Spark để tạo nên một loại ngôn ngữ lập trình lý tưởng khi xử lý khối lượng dữ liệu lớn trên nền tảng Big Data. Ngôn ngữ Scala còn có thể hỗ trợ xử lý song song trên quy mô lớn. Tuy nhiên người mới bắt đầu lập trình thì không nên sử dụng ngôn ngữ Scala có lộ trình học tập phức tạp.
Ngôn ngữ lập trình Julia
Tuy mới xuất hiện nhưng ngôn ngữ lập trình Julia rất phù hợp cho các máy tính có kỹ thuật cao. Người ta thường lựa chọn ngôn ngữ Julia bởi vì nó có tính đơn giản như Python và hiệu suất nhanh như ngôn ngữ lập trình C.
Vì vậy nhiều chuyên gia về máy tính đã đánh giá ngôn ngữ Scala rất lý tưởng cho các lĩnh vực đòi hỏi các hoạt động toán học phức tạp với khả năng vận hành thành tốc trên các tập dữ liệu lớn.
Ngôn ngữ lập trình thống kê SAS
Cũng giống như ngôn ngữ lập trình R, SAS được sử dụng để phân tích thống kê nhưng không phải là mã nguồn mở như R. Đây là một trong những ngôn ngữ lập trình lâu đời nhất trong lĩnh vực thống kê được sử dụng để phân tích nâng cao, mô hình dự đoán và thông minh kinh doanh.
Các chuyên gia và nhà phân tích đánh giá cao về ngôn ngữ SAS. Họ cho rằng đó là một nền tảng ổn định và an toàn phù hợp với mọi yêu cầu của các công ty. Mặc dù phần mềm SAS là nguồn đóng, chỉ cung cấp các thư viện và gói để phân tích thống kê và học máy. Ngôn ngữ lập trình SAS bị lỗi thời vì sự ra đời của những phần mềm nguồn mở gây tốn kém chi phí khi phải kết hợp các công cụ và tính năng nếu muốn sử dụng ngôn ngữ này.
Lời kết :
Ngôn ngữ định nghĩa dữ liệu thực chất là những ngôn ngữ lập trình được sử dụng trong lĩnh vực khoa học dữ liệu. Một nhà khoa học dữ liệu thực sự sẽ muốn tìm hiểu nhiều hơn về ngôn ngữ lập trình để tạo nên nhiều ứng dụng trên mạng internet phù hợp với thời đại công nghệ số 4.0.