http://www.w3.org/MarkUp/∞
HTML proviene de SGML (Standar Generalized Markup Language).
HTML era muy simple y orientado a definir estructura, pero la mayoría de las personas no piensa en forma estructurada. Esto llevo al (ab)uso de los tags como medios de formateo y la consiguiente confusión en un mar de tags (tag soup).
Además, las hojas de estilo y otras tecnologías requieren de documentos bien escritos. Los browser presionan por más características, los handhelds presionan por un subconjunto más simple. Lo que veía el grupo de HTML en el W3C era la importancia de mejorar los formularios, pero en ese contexto, habían otras tareas por hacer.
No se podía seguir "estirando" el lenguaje. Mejor usar algo modular y un conjunto de "perfiles" para los UserAgents, que son formas de expresar requerimientos mínimos o formas de transformar el marcado que no se entienda.
Diciembre 1997 HTML/4.0 (los últimos elementos agregados son frames, tbody, thead). En 1999 se genera un parche "HTML/4.01" que sería el último estándar recomendado. Ese mismo año y siguiendo el impulso de XML, se empieza a trabajar en XHTML.