12月7日、arXivが「accessible HTML - arXiv info」と題した記事を公開した。この記事では、研究論文のアクセシビリティ向上を目的とした、arXiv におけるHTML版提供の意義と今後の改善方針について詳しく紹介されている。

以下に、その内容を紹介する。
arXivとは何か
arXivは、物理・数学・計算機科学などの分野を中心に、研究者が論文のプレプリント(査読前論文)を公開するためのリポジトリである。1991年の創設以来、世界中の研究者が迅速に成果を共有する場として利用し、現在では200万件以上の論文が登録されている。研究の初期成果が即座に公開される文化を支え、オープンサイエンスを象徴する存在となっている。
arXivがHTML化を進める背景
研究論文へアクセスする際、PDFは一般的だが、視覚障害者やスクリーンリーダー利用者にとって読みづらい場合がある。arXivはこうしたアクセシビリティ課題を解消するため、PDFに加えてHTML版を提供する取り組みを開始した。
HTML化は現在、200万件を超える論文に対して段階的に実施されており、すべての論文が完全に変換できるわけではないものの、大部分が対応対象となる。HTML版は論文のアブストラクトページにリンクとして表示され、著者は投稿時にHTMLプレビューを確認できる。
今回の提供は「ベータ版」とされ、コミュニティからのフィードバックを得ながら改善を継続する計画である。
なぜ「experimental(実験的)」なのか
arXivの投稿の約90%はTeX形式、とくにLaTeXによって書かれている。LaTeXはきわめて柔軟かつ拡張可能であるため、著者ごとに構造やパッケージ使用が異なり、HTMLへの自動変換は容易ではない。一方、HTMLはスクリーンリーダー、読み上げツール、画面拡大、モバイル閲覧など支援技術との相性が良い。
こうした理由から、arXivは次の2点を根拠に「実験的なHTML版」を早期に公開した。
1. アクセシブルな形式を今すぐ必要とする研究者がいるため。
コミュニティ、とくにアクセシビリティ上の配慮が必要な研究者からの強い要望が寄せられた。2. コミュニティの協力が必要不可欠であるため。
既知の技術的問題には対応済みだが、特定のLaTeXパッケージに起因する問題を解消するには、実際の利用状況からの報告が欠かせない。
HTML版に表示される可能性のあるエラー
HTML版は依然として開発段階にあり、変換中のエラーメッセージが表示されることがある。arXivは原因の説明や著者側が取れる対策を公開しており、改善を続けている。
コミュニティが協力できること
1) HTML論文を読む・問題を報告する
HTML版を試し、以下の方法で問題を報告できる。
- アブストラクトページのHTMLリンクをクリック
- Open Issue ボタンを押して報告
- テキスト選択後 Open Issue for Selection を利用
Ctrl+?のショートカット- スクリーンリーダー利用者は
Alt+yでアクセシブル報告ボタンを切り替え
ただし 「PDFと見た目が違う」という理由だけの報告は控えてほしい と注意が添えられている。HTMLとPDFは構造が異なり、行折り返しや空白量、細かなレイアウトは一致しないのが前提であり、アクセシビリティを優先しているためである。
2) LaTeXからの変換改善に協力する
- 著者はLaTeX記述のベストプラクティスに従う
- 開発者はLaTeXMLプロジェクトが公開するパッケージ移植リストに協力可能
- 学会・出版社は、推奨クラスファイル(.cls)の見直しによってHTML変換の成功率向上に貢献できる
謝辞
arXivは、この取り組みに助言を寄せた障害当事者の研究者へ特別な感謝を示している。また、HTML変換を支える技術基盤として LaTeX Project と LaTeXML(NIST)チーム を挙げ、深い謝意を述べている。
詳細はaccessible HTML - arXiv infoを参照していただきたい。