XML Là Gì? Cú Pháp Căn Bản Của XML | PLC Schneider

XML là gì? Cú pháp căn bản của XML bao gồm những gì? XML và HTML có điểm nào giống và khác nhau? Hãy cùng theo dõi để tìm câu trả lời nhé.

1. XML là gì?

XML được ghi tắt từ tiếng Anh eXtensible Markup Language, có thể hiểu là “ngôn ngữ đánh dấu mở rộng”. Đây là ngôn ngữ đánh dấu với mục đích chung do W3C đề nghị, để tạo ra các ngôn ngữ đánh dấu khác.

Mục đích chính của XML là đơn giản hóa việc chia sẻ dữ liệu giữa các hệ thống khác nhau, đặc biệt là các hệ thống được kết nối với internet. XML dùng để cấu trúc, lưu trữ và trong trao đổi dữ liệu giữa các ứng dụng và lưu trữ dữ liệu.

XML là gì?

Ví dụ

Khi ta xây dựng một ứng dụng bằng PHP và một ứng dụng bằng Java thì hai ngôn ngữ này không thể hiểu nhau, vì vậy ta sẽ sử dụng XML để trao đổi dữ liệu.

Chính vì vậy, XML có tác dụng rất lớn trong việc chia sẻ, trao đổi dữ liệu giữa các hệ thống.

Các ngôn ngữ dựa trên XML như RDF, RSS, MathML, XHTML, SVG, GML và cXML được định nghĩa theo cách thông thường. Cho phép các chương trình sửa đổi và kiểm tra hợp lệ bằng các ngôn ngữ này mà không cần có hiểu biết trước về hình thức của chúng.

2. Đặc điểm của XML là gì?

Đặc điểm của XML là gì?

Ưu điểm XML

Tính độc lập

Đây được xem là ưu điểm lớn nhất của XML bởi nó được sử dụng để truyền đạt dữ liệu dưới dạng text (văn bản).

Nên các phần mềm và chương trình bình thường đều có thể đọc được file XML.

Đọc và phân tích nguồn dữ liệu tốt

XML đóng vai trò như một thông dịch viên khi đọc được nhiều loại ngôn ngữ. Giúp việc trao đổi dữ liệu giữa các chương trình và hệ thống khác dễ dàng hơn.

Ngôn ngữ XML hiển thị dưới dạng text nên bất kỳ chương trình nào cũng có thể hiểu được.

Tỷ lệ sai sót thấp

Khả năng sai sót trong truyền đạt của XML chỉ vào khoảng từ 5-7%.

Ngoài ra XML còn được sử dụng cho Remote Procedure Calls trên website nhằm phục vụ cho các dịch vụ mong muốn.

Hạn chế của XML

Tỷ lệ sai sót khi sử dụng XML để truyền dữ liệu khoảng từ 5-7%. Con số này tuy không quá cao, nhưng trên thực tế, người ta vẫn cần cân nhắc trước khi sử dụng nó để trao đổi thông tin.

3. Cú pháp cơ bản của XML

Khai báo XML (XML Declaration)

Tài liệu XML có thể tùy ý có một phần khai báo XML. Nó được viết như sau:

<?xml version=”1.0″ encoding=”UTF-8″?>

Ở đây, version là phiên bản XML và encoding xác định mã hóa ký tự được sử dụng trong tài liệu.

Các quy tắc cú pháp khai báo XML

Khai báo XML (XML declaration) là phân biệt kiểu chữ và phải bắt đầu với “<?xml>” ở đây “xml” viết ở dạng chữ thường.

Nếu tài liệu chứa khai báo XML, thì nó phải là lệnh đầu tiên của tài liệu XML.

Khai báo XML phải là lệnh đầu tiên của tài liệu XML.

Một HTTP Protocol có thể ghi đè giá trị của encoding mà bạn đặt trong khai báo XML.

Tags và Elements

Một XML file được cấu thành bởi một số phần tử XML (Element), còn được gọi là XML-node hoặc XML-tags. Tên các phần tử XML được bao trong các dấu < > như sau:

<element>

Quy tắc cú pháp cho Tags và Elements

  • Cú pháp phần tử

Mỗi phần tử XML cần được bao trong hoặc với phần tử bắt đầu hoặc kết thúc như sau:

<element>….</element>

Hoặc đơn giản theo cách:

<element/>

  • Lồng các phần tử

Một phần tử XML có thể chứa nhiều phần tử XML khác như là con của nó, nhưng các phần tử con này phải không đè lên nhau.

Ví dụ: Một thẻ đóng của một phần tử phải có cùng tên như thẻ mở kết nối với nó.

Ví dụ sau minh họa các thẻ lồng nhau sai cú pháp:

Ví dụ sau minh họa các thẻ lồng nhau sai cú pháp:

Ví dụ sau minh họa các thẻ lồng nhau đúng cú pháp:

Ví dụ sau minh họa các thẻ lồng nhau đúng cú pháp:

  • Phần tử gốc (Root Element)

Một tài liệu XML có thể chỉ có một phần tử gốc. Ví dụ sau minh họa một tài liệu XML sai cú pháp, bởi vì cả hai phần tử x và y xuất hiện ở cấp cao nhất mà không phải là một phần tử gốc.

Phần tử gốc (Root Element)

Còn đây là ví dụ về đúng cú pháp:

  • Phân biệt kiểu chữ

Tên của các phần tử XML là phân biệt kiểu chữ. Nghĩa là tên của thẻ mở và thẻ đóng phải cùng kiểu.

Ví dụ, <contact-info> là khác với <Contact-Info>.

Thuộc tính (Attributes)

Một thuộc tính xác định thuộc tính cho phần tử, sử dụng một cặp tên/giá trị. Một phần tử XML có thể có một hoặc nhiều thuộc tính. Ví dụ:

<a href=”http://plcschneider.com/”>plcschneider</a>

Ở đây href là tên thuộc tính và https://topdev.vn/ là giá trị thuộc tính.

Qui tắc cú pháp cho thuộc tính trong XML

Tên thuộc tính trong XML là phân biệt kiểu chữ (không giống như HTML). Tức là, HREF và href là hai thuộc tính khác nhau trong XML.

Cùng một thuộc tính không thể có hai giá trị trong một cú pháp. Ví dụ sau là sai cú pháp bởi vì thuộc tính b được xác định hai lần:

<a b=”x” c=”y” b=”z”>….</a>

Tên thuộc tính được định nghĩa không có sự trích dẫn, trong khi giá trị thuộc tính phải luôn luôn trong các dấu trích dẫn. Ví dụ sau là sai cú pháp:

<a b=x>….</a>

Trong ví dụ này, giá trị thuộc tính không được định nghĩa trong các dấu trích dẫn.

Tham chiếu trong XML

Tham chiếu (References) thường cho phép bạn thêm hoặc bao phần text hoặc phần đánh dấu bổ sung trong một tài liệu XML. Các tham chiếu luôn luôn bắt đầu với biểu tượng “&” , đây là ký tự dành riêng và kết thúc với ký tự “;”.

XML có hai kiểu tham chiếu:

Tham chiếu thực thể (Entity Reference)

Một tham chiếu thực thể chứa một tên giữa dấu tách mở và dấu tách đóng.

Ví dụ: & có amp là tên. Tên tham chiếu tới một chuỗi văn bản hoặc đánh dấu đã được định nghĩa trước.

Tham chiếu ký tự (Character Reference)

Chứa các tham chiếu, ví dụ A, chứa một dấu băm (#) được theo sau bởi một số. Số này luôn luôn tham chiếu tới mã hóa Unicode của ký tự.

Trong ví dụ này, 65 tham chiếu tới chữ cái “A”.

Text trong XML

Tên của phần tử XML và thuộc tính XML là phân biệt kiểu chữ, nghĩa là tên của phần tử mở và phần tử đóng phải ở được viết cùng kiểu.

Để tránh các vấn đề về mã hóa ký tự, tất cả XML file nên được lưu ở dạng Unicode UTF-8 hoặc UTF-16.

Các ký tự whitespace như khoảng trắng, tab và ngắt dòng giữa các phần tử XML và giữa các thuộc tính XML sẽ bị bỏ qua.

Một số ký tự được dành riêng trong cú pháp XML. Vì thế, chúng không thể được sử dụng một cách trực tiếp. Để sử dụng chúng, một số thực thể thay thế được sử dụng, các thực thể này được liệt kê trong bảng dưới:

Ký tự không được phép sử dụng Thực thể thay thế Miêu tả
< < Nhỏ hơn
> > Lớn hơn
& &
' Dấu nháy đơn
" Trích dẫn kép

4. Sự khác nhau giữa XML và HTML

Sự khác nhau giữa XML và HTML

Giống nhau: Điểm chung duy nhất giữa XML và HTML chính là việc chúng đều là các thẻ (tag).

Khác nhau:

XML HTML
Cho phép người dùng tạo biểu tượng đánh dấu riêng để mô tả nội dung. Tạo biểu tượng không giới hạn và tự định nghĩa Được định nghĩa từ trước và người dùng phải tuân thủ
Được sử dụng để truyền tải, mã hóa và lưu trữ dữ liệu Được thiết kế để hiển thị dữ liệu

Lưu ý: XML không phải là thay thế cho HTML.

Ví dụ:

<?xml version=”1.0″ encoding=”UTF-8″?>

<article>

<title>XML là gì</title>

<author>plcschneider</author>

<year>2021</year>

</article>

Bash

XML cũng được sử dụng để giúp định dạng các loại tài liệu khác. Sau đây là một số định dạng bạn có thể biết:

  • RSS
  • Microsoft .NET sử dụng XML cho các file cấu hình của nó.
  • Sitemap

>>> Xem thêm: C++ là gì? Các ứng dụng của C++

Từ khóa » Cú Pháp Xml