DTD - สร้างโมดูล XML
องค์ประกอบหลักของเอกสาร XML และ HTML คือแทร็กแบตที่เหมือน <body>...</body>
องค์ประกอบเอกสาร XML
เอกสาร XML ทุกตัว (และเอกสาร HTML) ประกอบด้วยองค์ประกอบที่เรียบง่ายต่อไปนี้:
- องค์ประกอบ
- คุณสมบัติ
- ตัวเลข
- PCDATA
- CDATA
ลักษณะสั้นๆ ขององค์ประกอบทุกตัว
องค์ประกอบ
องค์ประกอบเป็นองค์ประกอบหลักของเอกสาร XML และ HTMLองค์ประกอบหลัก。
ตัวองค์ประกอบของ HTML คือ "body" และ "table" ตัวองค์ประกอบของ XML คือ "note" และ "message" องค์ประกอบสามารถมีข้อความ องค์ประกอบอื่น หรือเป็นช่องว่าง ตัวองค์ประกอบ HTML ที่เป็นช่องว่างคือ "hr" และ "br" และ "img"
ตัวอย่าง:
<body>ข้อความที่อยู่ระหว่าง</body> <message>ข้อความที่อยู่ระหว่าง</message>
คุณสมบัติ
คุณสมบัติสามารถให้ข้อมูลเพิ่มเติมเกี่ยวกับองค์ประกอบ。
คุณสมบัติเป็นที่ตั้งในแทร็กแบตทิ้งขององค์ประกอบ คุณสมบัติเป็นที่ตั้งด้วยคำว่าชื่อ/ค่ามีลักษณะที่ปรากฏขึ้นเป็นคู่
<img src="computer.gif" />
ชื่อองค์ประกอบคือ "img" ชื่อของคุณสมบัติคือ "src" ค่าของคุณสมบัติคือ "computer.gif" เนื่องจากองค์ประกอบเป็นช่องว่าง จึงถูกปิดด้วย "/"
ตัวเลข
ตัวเลขที่เป็นตัวแทนของตัวเลขเป็นตัวแทนของข้อความทั่วไป อ้างอิงตัวเลขคืออ้างอิงตัวเลข
ส่วนใหญ่ของนักเรียนที่รู้ถึงอ้างอิงที่เป็นตัวแทนของตัวเลขนี้: " " ตัวเลขนี้ที่เรียกว่า "space without line break" ใช้ใน HTML ในการใส่ช่องว่างเพิ่มเติมในเอกสาร
ขณะที่เอกสารถูกประมวลโดยตัวประมวล XML ตัวเลขจะถูกแบ่งเปิด
ตัวเลขดังนี้ถูกกำหนดล่วงหน้าใน XML:
อ้างอิงที่เป็นตัวแทนของตัวเลข | ตัวอักษร |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA หมายถึงข้อมูลแนวตั้งที่ถูกประมวล
อาจจะคิดว่าข้อมูลแนวตั้งเป็นข้อความที่อยู่ระหว่างแทร็กแบตทิ้งของอิเล็กทรอนิกส์อิเล็กทรอนิกส์
PCDATA จะถูกประมวลโดยตรงโดยตัวประมวล
ข้อความที่มีแทร็กเกอร์จะถูกประมวลเป็นทางหลัก และส่วนที่มีตัวอักษรจะถูกแบ่งเปิด
不過,被解析的字符數據不應當包含任何 &、< 或者 > 字符;需要使用 &、< 以及 > 實體來分別替換它們。
CDATA
CDATA 的意思是字符數據(character data)。
CDATA 是不會被解析器解析的文本。在這些文本中的標籤不會被當作標記來對待,其中的實體也不會被展開。