DTD - So sánh phần tử và thuộc tính

Các mô đun xây dựng chính của tài liệu XML và HTML là các thẻ giống như <body>....</body>.

Mô đun xây dựng tài liệu XML

Tất cả các tài liệu XML (và HTML) đều được cấu thành từ các mô đun xây dựng đơn giản sau:

  • phần tử
  • Thuộc tính
  • thực thể
  • PCDATA
  • CDATA

Dưới đây là mô tả ngắn gọn về mỗi mô đun xây dựng:

phần tử

Phần tử là các mô đun xây dựng chính của tài liệu XML và HTML.Các mô đun xây dựng chính

Các phần tử HTML là "body" và "table". Các phần tử XML là "note" và "message". Các phần tử có thể chứa văn bản, các phần tử khác hoặc trống. Các phần tử HTML trống là "hr"、"br" và "img".

Ví dụ:

<body>body text in between</body>
<message>some message in between</message>

Thuộc tính

Thuộc tính có thể cung cấpThông tin thêm về phần tử

Thuộc tính luôn được đặt trong thẻ bắt đầu của một phần tử. Thuộc tính luôn bắt đầu bằngTên/giá trịthường xuất hiện theo cặp. Phần tử "img" sau có thêm thông tin về tệp nguồn:

<img src="computer.gif" />

Tên phần tử là "img". Tên thuộc tính là "src". Giá trị thuộc tính là "computer.gif". Do phần tử本身 trống, nó được đóng lại bằng " /".

thực thể

Thực thể được sử dụng để định nghĩa các biến văn bản. Tham chiếu thực thể là sự tham chiếu đến thực thể.

Hầu hết các bạn đều biết về tham chiếu thực thể HTML này: " ". Thực thể 'không gấp dòng' này trong HTML được sử dụng để chèn thêm một khoảng trống trong tài liệu.

Khi tài liệu được bộ phân tích XML phân tích, các thực thể sẽ được mở rộng.

Các thực thể sau được định nghĩa sẵn trong XML:

tham chiếu thực thể ký tự
< <
> >
& &
" "
' '

PCDATA

PCDATA có nghĩa là dữ liệu ký tự được phân tích (parsed character data).

Có thể tưởng tượng dữ liệu ký tự là văn bản giữa thẻ bắt đầu và thẻ kết thúc của phần tử XML.

PCDATA là văn bản sẽ được phân tích bởi bộ phân tích. Các văn bản này sẽ được bộ phân tích kiểm tra các biểu tượng và dấu hiệu.

Các thẻ trong văn bản sẽ được xử lý như các dấu hiệu, trong khi các phần tử sẽ được mở rộng.

Tuy nhiên, dữ liệu ký tự được phân tích không nên chứa bất kỳ ký tự &、< hoặc > nào; cần sử dụng các biểu tượng &、< và > để thay thế chúng.

CDATA

CDATA có nghĩa là dữ liệu ký tự (character data).

CDATA là văn bản không được phân tích cú pháp bởi bộ phân tích cú pháp.Các thẻ trong văn bản này sẽ không được coi là thẻ, và các thực thể trong đó sẽ không được mở rộng.