2月4日、404 Mediaが「‘Forbidden Words’: Github Reveals How Software Engineers Are Purging Federal Databases」と題した記事を公開した。この記事では、アメリカ政府のデータベースにおいて多様性やジェンダーに関する語句を「禁止用語」として削除するソフトウェアエンジニアの動きについて詳しく紹介されている。
この記事によると、米国保健福祉省(HHS)が管理するデータベースで、差別やジェンダーなどの要素が含まれる「DEI(Diversity, Equity, Inclusion)」関連の用語が削除されている事例が確認された。これらの作業は、政府内部あるいは政府の委託を受けたエンジニアによって実行されているという。
該当のデータベースは、主にHHS傘下のOffice of Head Startが運営するもので、低所得世帯など脆弱な環境にある子どもや家族を支援するプログラム情報を管理している。GitHub上のコミット履歴には 「Remove-DEI」という名のプロジェクトが記録されており、 そこでは「禁止用語」に指定された単語の全面的な削除や、それに付随する検索機能の停止・改変などが行われている。
具体的には「Families affected by systemic discrimination/bias/exclusion(体系的な差別や偏見、排除の影響を受けた家族)」というターゲットに関する項目や、関連する検索フィルタが削除されている形跡がある。こうした変更は、従来は外部からは見えにくかったが、GitHubコミットの公開情報を通じて明らかになったとされている。
記事によれば、現場のエンジニアたちは「禁止用語」を漏れなく除去するため、検索機能やフィルタ機能を根本的に改変するコードを書き換え、GitHub上で互いに議論を重ねながら、DEIに関連する文言を段階的に削っているという。

背景には、トランプ政権下で出された「人種やジェンダーに関わる要素を政府機関から排除する」という複数の大統領令があるとされる。記事では、連邦政府が所管するデータセットの多くがインターネット上から削除されたり、機能的に利用価値を損なわれたりしている現状にも触れられている。
エンジニアたちのGitHub上のやり取りは「特定の単語をコードベースから排除するだけでなく、関連する検索機能自体を削るなど、より強引な手法を用いている」と示唆している。実際にコミットメッセージでは、「エクイティ(公平性)に関する項目を除外した」「システム的差別を対象とするトピックをフィルタから削除した」などの作業内容が確認できる。
これらの作業は、アメリカ政府のシステムを外部から監視・検証しづらくし、 DEIに関する情報へのアクセスを制限する可能性があるという指摘がある。HHSが運営するHead Startプログラムは毎年120億ドル規模の予算を投じており、低所得家庭や移民など社会的に脆弱な立場にある子どもたちの支援を担っているため、そのプログラム評価からDEIに関連するデータを除去することが、施策全体の有効性を見えにくくする危険性があるとも報じられている。
なお、404 Mediaの記事では「連邦職員や契約社員で、情報提供を希望する場合は職場外のデバイスからSignalまたはメールで連絡してほしい」という呼びかけもなされていた。現時点で、今回の削除や機能改変がどの程度の範囲に及んでいるかは明確ではないが、他の省庁や機関においても同様の作業が進んでいることを示唆する報告が複数ある。
詳細は‘Forbidden Words’: Github Reveals How Software Engineers Are Purging Federal Databasesを参照していただきたい。