請嘗試輸入以下XHTML代碼并在IE中瀏覽:<p>hello <script type="text/javascript" /> world</p>,你會發現只能看到前面的hello而不見后面的world,這事情讓人挺無法解釋的吧。可能有不少人都曾經遇到過這個問題,并且花了幾個小時在上面都找不到合理的解釋。
解釋源自另外一段類似的代碼:<p>hello <textarea /> world</p>,你在IE中看看其顯示效果,能夠得到合理的解釋了嗎?我們能夠看到前面的hello正常顯示了,而后面的world則顯示在textarea里面,這證明IE并沒有正確識別textarea標簽已經自關閉了,而是當它沒有關閉,并將后面的內容識別為textarea內部的內容。
這時候我們就明白前面那段代碼為什么看不到后面的world了,因為它被當作script的一部分來識別了。這就說明了,在我們使用XHTML時并不能好像XML那樣隨意的使用自關閉的寫法,只有少數原本不需要關閉的標簽可以用自關閉的寫法,其他標簽即使沒有任何內容最好也用成對的關閉寫法。
最后需要提醒大家的是,其實弱智的parser不僅僅IE有,很多地方都可能碰到由于parser不嚴謹而引起的問題,所以我們在書寫XHTML的時候還是要遷就一些老HTML繼承下來的習慣,不能好像真的XML那樣自以為符合標準了就隨意寫。不信?那么再試一個吧:<p>hello <br></br> world</p>,留意IE與Opera中的顯示效果。
Update: 有部分讀者認為我舉的例子是不符合XHTML規范的,那么請先閱讀XHTML規范。Empty Elements一節的中文翻譯如下:“空元素必須要么有一個結束標記,要么以/>結束,例如<br/>或<hr></hr>。請參考HTML兼容性標準以獲取關于確保向后兼容HTML4瀏覽器的信息。”可以看得到,規范中也給出了<hr></hr>這樣的例子,說明<br></br>的寫法是符合XHTML規范的,只是沒有兼容HTML4標準。那么到底XHTML是否兼容HTML4呢?我們來看Compatibility Issues一節,中文翻譯如下:“雖然并沒有要求XHTML1.0文檔兼容現有的瀏覽器,但在實踐中這并不難做到。”因此,XHTML是沒有規定文檔必須向下兼容,我給出的例子都是合法的XHTML文檔片斷,當出現在完整的XHTML里面時也全部能通過W3C Markup Validation Service的驗證。
Update again: 其實我寫這篇文章的目的不是為了強調只符合XHTML規范就行了,也不是強調符合XHTML同時兼容HTML4就夠了,而是應該考慮更多需要兼容的情況。例如你的CMS中允許用戶提交HTML,提交的HTML經過SgmlReader或者其他方法格式化為XHTML,同時或許還做了其它XML處理,這時候就有可能將用戶提交的<textarea></textarea>轉換為<textarea />,這種情況下你需要通過跟蹤調試找出問題并不容易,因為XML處理并沒有違反任何規范,每一步的處理都是符合語義的。另外最好不要把<br />寫成<br/>,因為確實有些弱智的parser僅僅因為少了一個空格就無法正確識別。