DTD - بسته‌سازی XML

بخش‌های اصلی ساختار مستندات XML و HTML برچسب‌هایی مانند <body>...</body> هستند.

بخش‌های ساختار مستندات XML

تمام مستندات XML (و مستندات HTML) از بخش‌های ساختار ساده زیر تشکیل شده‌اند:

  • عنصر
  • ویژگی
  • اشاره‌ی فرانت‌نت
  • PCDATA
  • CDATA

در زیر توضیح مختصری از هر بخش ساختار آمده است.

عنصر

عنصر بخش‌های اصلی ساخت XML و HTML مستندات هستندبخش‌های اصلی ساخت.

مثال‌های عنصر HTML "body" و "table" هستند. مثال‌های عنصر XML "note" و "message" هستند. عناصر می‌توانند متن، عناصر دیگر یا خالی باشند. مثال‌های عناصر خالی HTML "hr"، "br" و "img" هستند.

مثال:

<body>متن بین</body>
<message>پیام در بین</message>

ویژگی

ویژگی‌ها می‌تواننداطلاعات اضافی در مورد عنصر.

ویژگی‌ها همیشه در برچسب شروع یک عنصر قرار می‌گیرند. ویژگی‌ها همیشه بانام/مقداربه صورت جفت ظاهر می‌شوند. عنصر "img" زیر دارای اطلاعات اضافی در مورد فایل منبع است:

<img src="computer.gif" />

نام عنصر "img" است. نام ویژگی "src" است. ارزش ویژگی "computer.gif" است. به دلیل اینکه عنصر خالی است، با یک "/" بسته می‌شود.

اشاره‌ی فرانت‌نت

اشاره‌ی فرانت‌نت برای تعریف متون معمولی استفاده می‌شود. اشاره‌ی فرانت‌نت به اشاره‌ی فرانت‌نت اشاره دارد.

بسیاری از دانش‌آموزان این اشاره‌ی فرانت‌نت HTML را می‌شناسند: " ". این اشاره‌ی فرانت‌نت "space non-breaking" در HTML برای قرار دادن یک فضای اضافی در یک مستند استفاده می‌شود.

وقتی یک مستند توسط پردازش‌گر XML پارسیده می‌شود، اجسام گسترش می‌یابند.

در زیر لیستی از اجسام در XML پیش‌تعریف شده است:

اشاره‌ی فرانت‌نت حرف
< <
> >
& &
" "
' \'

PCDATA

مفهوم PCDATA به معنای داده‌های حروفی پارسیده‌شده (parsed character data) است.

می‌توان داده‌های حروفی را به عنوان متن بین برچسب‌های شروع و پایان یک عنصر XML تصور کرد.

PCDATA توسط پردازش‌گر پارسیده می‌شود. این متن توسط پردازش‌گر برای بررسی اجسام و نشانه‌ها بررسی می‌شود.

برچسب‌های موجود در متن به عنوان نشانه‌ها پردازش می‌شوند و اجسام گسترش می‌یابند.

اما داده‌های کاراکتری پردازش شده نباید شامل هیچ &، < یا > باشند؛ باید از عناصر &، < و > برای جایگزینی آنها استفاده شود.

CDATA

CDATA به معنای داده‌های کاراکتری (character data) است.

CDATA متنی است که پردازش‌کننده آن را پردازش نمی‌کند.برچسب‌های موجود در این متون به عنوان نشانه‌ها در نظر گرفته نمی‌شوند و اجزا نیز باز نمی‌شوند.