DTD - Mô-đun xây dựng XML

Module xây dựng chính của tài liệu XML và HTML là các thẻ tương tự như <body>....</body>.

Module xây dựng tài liệu XML

Mọi tài liệu XML (và tài liệu HTML) đều được cấu thành từ các module xây dựng đơn giản sau:

  • yếu tố
  • Thuộc tính
  • Thực thể
  • PCDATA
  • CDATA

Dưới đây là mô tả ngắn gọn về mỗi module xây dựng.

yếu tố

Các yếu tố là module xây dựng chính của tài liệu XML và HTMLCác module xây dựng chính.

Ví dụ về yếu tố HTML là "body" và "table". Ví dụ về yếu tố XML là "note" và "message". Các yếu tố có thể chứa văn bản, các yếu tố khác hoặc trống. Ví dụ về yếu tố HTML trống là "hr", "br" và "img".

Ví dụ:

<body>body text in between</body>
<message>some message in between</message>

Thuộc tính

Các thuộc tính có thể cung cấpThông tin bổ sung về yếu tố.

Các thuộc tính luôn được đặt trong thẻ mở của một yếu tố. Các thuộc tính luôn bắt đầu bằngTên/Giá trịthuộc tính thành cặp xuất hiện. Các yếu tố "img" bên dưới có thông tin bổ sung về tệp nguồn:

<img src="computer.gif" />

Tên phần tử là "img". Tên thuộc tính là "src". Giá trị thuộc tính là "computer.gif". Do phần tử trống, nó được đóng lại bằng " /".

Thực thể

Thực thể được sử dụng để định nghĩa các biến văn bản. Tham chiếu thực thể là việc tham chiếu đến thực thể.

Hầu hết các bạn đều biết về việc tham chiếu thực thể HTML này: " ". Thực thể 'không gãy hàng' này trong HTML được sử dụng để chèn thêm một khoảng trống trong tài liệu.

Khi tài liệu được bộ phân tích XML phân tích, các thực thể sẽ được mở rộng.

Các thực thể sau được định nghĩa sẵn trong XML:

Tham chiếu thực thể Ký tự
< <
> >
& &
" "
' '

PCDATA

PCDATA có nghĩa là dữ liệu字符 được phân tích cú pháp (parsed character data).

Bạn có thể tưởng tượng dữ liệu字符 là văn bản giữa thẻ bắt đầu và thẻ kết thúc của phần tử XML.

PCDATA là văn bản được phân tích cú pháp bởi bộ phân tích. Các văn bản này sẽ được bộ phân tích kiểm tra các thực thể và các thẻ.

Các thẻ trong văn bản sẽ được coi là thẻ, và các thực thể sẽ được mở rộng.

Nhưng dữ liệu字符 được phân tích cú pháp không nên chứa bất kỳ ký tự &、< hoặc > nào; cần sử dụng các实体 &、< và > để thay thế chúng.

CDATA

CDATA có nghĩa là dữ liệu字符 (character data).

CDATA là văn bản không bị phân tích cú pháp bởi bộ phân tích.Các thẻ trong văn bản này sẽ không được coi là thẻ, các thực thể cũng sẽ không được mở rộng.