HTMLとは
HTMLは、Web上の文書記述のためのマークアップ言語で、正式名称HyperText Markup Languageのそれぞれの頭文字を取ったもの。
HTMLの標準仕様は、従来W3C(World Wide Web Consortium)により策定されていたが、2022年7月現在、HTML Living Standardのことを指す。
これは、Apple、Mozilla、Opera の開発者らが設立したWHATWG(Web Hypertext Application Technology Working Group)で進められていた仕様(HTML Living Standard)を、W3Cが2021年1月29日、Recommendation(勧告)として発表したためである。
前回のebookpediaでは、おもにW3Cが勧告したHTML5を前提に解説をしたが、今回の記事アップデートまでの間に、上記のような動きがあったため、今回はそのあたりを含めながら、技術的なアップデート内容について紹介していく。
もっと詳しく!
HTML5について
まずはじめに、HTML5の歴史を紹介する。
HTML5の歴史
HTML5がドラフトとして初めて発表されたのが2008年1月である。このとき、WWW(Word Wide Web)が誕生してから約18年が経っており、ブロードバンドや携帯電話の普及により、Webページが一般的になったきていた。一方で、当時利用されていたHTML4では、表現の複雑さや閲覧環境によって異なる表現の差異、とくにアクセシビリティの概念が強まったことで、HTML5ではそれらを再考し、記述できる仕様について(マークアップ)言語作成が進んでいった。
HTMLは業界団体であるW3Cが中心となって策定を進めていたのだが、HTML5はW3Cではなく、WHATWGが中心となって策定が進められたバージョンでもあった。これは、Webがページではなく、アプリケーションとしての特徴を持つようになったこと、それに起因して、バージョン4までは言語仕様だけで標準化が進み、実装に関してはベンダや開発者が独自に進めた結果、相互互換性が保てなくなったからでもあった。
こうして、技術的進化に加えて、相互互換性、それとともにアクセシビリティに関しても強く意識が働くようになり、6年半の歳月をかけて、2014年10月28日にHTML5が最終勧告となった。
そして、前回のebookpedia記事公開の2015年10月から、HTML(HTML5)を取り巻く環境が大きく変わった。背景には、2019年5月28日に、W3CとWHATWGがHTMLおよびDOM(Document Object Model)に関する仕様の単一化に関して合意し、HTMLの仕様策定を共同作業とすることになった事情がある。
これにより、HTML5を含めた従来のW3Cで進められていたHTMLの仕様の開発は終了し、HTMLを中心としたWeb技術を開発するコミュニティWHATWGが進めるHTML Living Standardが標準仕様として採用されることになった。
その後、HTMLを含めた各種仕様の標準化団体W3Cが、2020年9月に新しいプロセス文書と特許ポリシーを公開し、2021年1月29日、WHATWGにあったHTML Review DraftがW3Cによって勧告(Recommendation)され、HTML Living Standardが唯一のHTMLの仕様となった。
2022年7月現在、当初HTML5と言われていたものも含め、HTMLの最新仕様はこのHTML Living Standardのことを指す。
本記事では、以降断りがない限り、HTMLと表記したものは、HTML Living Standardを意味する。
HTMLの特徴
HTMLの一番の特徴は、多様化するデバイスおよびリーダー(Webブラウザ)に対応すべく、記述した内容を誰もが同じように読解できるような言語にしてある点(アクセシビリティの担保)。とくに文書型宣言に関してはモードの指定のみの意味をもたせ、XHTMLの構文を採用している。代わりに、文書構造を明確にする記法が採用されている。その他、旧来のHTML5の開発に伴い、音声や動画など文字情報以外の多数のメディアをサポートするようになった。
旧来のHTML5とHTML Living Standardの比較
上述の通り、異なる策定団体、それぞれの方針違いがあったため、複数のHTMLが存在していたわけだが、開発する立場として気になるのは、旧来のHTML5とHTML Living Standardの違いである。
結論から言うと、記述の観点では大きな違いはない。従来どおり、<!DOCTYPE html>で始まる明確な文書構造で、旧来のHTML5の特徴でもあった、音声や動画などの文字情報以外のメディアはサポートされている。
その他、img要素のalt属性もそのまま使えるため、alt属性の拡充による画像ファイルのサポート、音声・動画要素のテキストトラック補完と言った形で、より、人間に近い、優しい情報提供が行える。
HTML Living Standardでも、これらの特徴がそのまま踏襲され、アクセシビリティの確保は重要な特徴の1つとなっている。
余談ではあるが、HTMLを記述言語として利用するWWW(World Wide Web)の生みの親、Tim Berners-Leeは「一度作ったURL(URI)、すなわちWebページは変更(削除)せず、残すべき」と情報アーカイブの重要性を強く主張している。
アクセシビリティの担保は、このアーカイブの重要性と対で考えることであり、HTML5以降のリリースでは、Tim Berners-Lee が目指すWWWの世界に一歩近づいていると筆者は考えている。
HTML Living Standardで変更した要素、属性
HTML Living Standardでは、見出しのグループ化をする<hgroup>、スロットのための<slot>といった要素が追加され、操作メニュー項目を扱う<rb>、<rtc>は廃止となった。
その他、<a>や<area>に”ping”属性が追加されるなど、既存の要素に属性が追加されている。<img>には”loading”属性が追加され、画像の読み込みのタイミングを指定できるようになった。
電子書籍とHTML
最後に、前回の記事と同様に、電子書籍の観点から、HTMLについて考察してみる。
電子書籍の定番フォーマットとなったEPUB3は、HTMLとCSS3をベースにしている。とくに多くの出版社が、大手電子書店を経由して提供している電子書籍・電子雑誌においては、HTMLやCSS3は欠かすことのできない技術である。
表現力豊かなHTMLだからこそ気をつけること
HTMLは、HTML5以降、非常に多彩な表現を実現できるようになった。しかし、これは仕様上での表現の可能性であって、電子書籍・電子雑誌を実現するうえでは、次の点に気をつけたい。
紙の出版物が前提となる制約とHTMLの親和性
多くの出版社の場合、紙を前提に「本」「雑誌」を作っている。つまり、紙前提の構造を意識して、電子化することが大事だろう。それは、表紙であり、扉であり、本文であり、索引であり、“書籍”の体をなすために必要な要素である。さらにブレイクダウンをして、ページの中にある見出しや脚注、図なども、書籍として重要な要素だ。
これらの書籍が持っているさまざまな要素をしっかりと理解し、構造化すること、それが電子書籍・電子雑誌制作にとって重要となる。
さらに、前述の通りHTMLには「明確な文書構造」を実現するという特徴があるため、紙前提で進めなければいけないという制約を、技術的に補完してくれる。EPUB3が、電子出版市場の標準フォーマットとして定着した理由の1つは、HTMLが持つ文書構造を明確にできる点だと、筆者は考えている。
正しい文書構造で確保できるアクセシビリティ
もう一点、HTMLはアクセシビリティの担保が行える、すなわち、誰もがどのような状況でも同じように情報にアクセスできる(情報を得られる)特徴を持つ。
HTMLで表現されたコンテンツは汎用的な環境で閲覧できる。たとえば、パソコンだったりスマートフォンだったり、公共の場にあるデジタルサイネージだったり。HTMLはこれらのスクリーンに対して、(記述上は)同じ情報を提供できる。これは、そのまま、電子書籍・電子雑誌にも適用される特徴だ。
その画面サイズや色味は、利用者が持つデバイスに依存する。つまり、電子書籍・電子雑誌は、Webサイトと同様に、読者が利用する環境によって、見る(目の前の)レイアウトや見た目が変わってしまう。つまり、HTMLの多様性が、読者環境の選択の幅を広げているわけである。
これは、紙のようにレイアウトが固定されているコンテンツとはまったく異なる特徴であり、HTMLを利用する電子書籍にも当てはまる。この点も、電子書籍に関わる人間がHTMLを扱う際に意識しなければいけないポイントと筆者は考えている。つまり、紙の書籍と異なり、「電子書籍は読み手に環境を委ねる」ということである。
これは、電子出版市場が今のような規模まで成長する前から言われていたことであり、実際、この特徴を意識したコンテンツを提供する企業は大きく成長し、掴みきれなかった企業は成長が鈍くなった。
この傾向は今後も変わることがないと筆者は考え、今後も電子書籍・電子雑誌に関わる立場、とくに編集者やデザイナーなどの制作者はこの点を意識した編集・デザインスキルを身につけてほしい。また、販売の観点からは、電子書籍の流通、すなわち配信の形態も変化するため、営業やマーケティングの変化も意識していく必要がある。
リッチメディアの活用はまだ先
一方、前回の記事公開から7年経って、思いのほか進化・進展しなかったこともある。それは、音声や動画といったリッチメディアの活用である。
本来なら、HTMLがベースとなるEPUB3であれば音声や動画が扱える。しかし、2022年現在、大手書店経由で配信される電子書籍・電子雑誌では、それらを活用するのが難しい。なぜなら、各書店が提供するリーダーが、リッチメディアへの対応が進んでいないからである。
だからこそ、電子出版市場が次のステージに進むには、コンテンツを提供する出版社や制作者に加えて、読者が利用する電子書籍リーダーの大幅な進歩が必要だと筆者は考えている。
以上、HTMLという技術が電子出版市場に与えた影響は大きく、また、日々変化・進化している。そのため、今後もメリットも注意点も増えていくだろう。だからこそ電子書籍・電子書籍の可能性がますます広がっていくと筆者は考えている。