Chương này trình bày cho bạn về việc xử lý khoảng trắng (WhiteSpace) trong tài liệu XML. Khoảng trắng là một tập hợp gồm các khoảng trống, tab và newline (dòng mới). Nói chung, chúng được sử dụng để làm cho tài liệu dễ đọc hơn.

Tài liệu XML chứa hai loại khoảng trắng: Khoảng trắng quan trọngkhoảng trắng không quan trọng. Dưới đây là phần giải thích chi tiết:

Khoảng trắng quan trọng trong XML

Khoảng trắng quan trọng xuất hiện bên trong phần tử mà chứa text cùng với phần đánh dấu. Ví dụ:

<name>TanmayPatil</name>

<name>Tanmay Patil</name>

Hai phần tử trên là khác nhau bởi vì có khoảng trống ở giữa TanmayPatil. Bất kỳ chương trình nào khi đọc phần tử này trong một XML file sẽ phải duy trì sự khác nhau này.

Khoảng trắng không quan trọng trong XML

Khoảng trắng không quan trọng tức là các khoảng trắng ở đó chỉ có nội dung phần tử được cho phép. Ví dụ:

<address.category="residence">

hoặc

<address....category="..residence">

Hai ví dụ trên là giống nhau. Ở đây, khoảng trống được biểu diễn bởi các dấu chấm (.). Trong ví dụ trên, khoảng trống giữa addresscategory là không quan trọng.

Một thuộc tính đặc biệt xml:space có thể được đính kèm với một phần tử. Nó chỉ rằng khoảng trắng nên bị gỡ bỏ cho phần tử đó bởi ứng dụng. Bạn có thể thiết lập thuộc tính này là default hoặc preserve như trong ví dụ sau:

<!ATTLIST address  xml:space (default|preserve) 'preserve'>

Ở đây:

  • Giá trị default chỉ rằng chế độ xử lý khoảng trắng mặc định của một ứng dụng nên chấp nhận phần tử này.
  • Giá trị preserve chỉ rằng ứng dụng nên duy trì tất cả khoảng trắng.