Googleは内部ドキュメントを誤ってGitHubに公開し、Apacheライセンスが恒久的に付与された ー そんな珍事が、SEO業界を中心としたWebの世界を大きく揺るがせている。
特に、過去の説明との矛盾がSEO専門家たちの怒りを大きく買っているようだ。
Googleは内部の技術文書をGitHubに誤って公開し、その文書には検索エンジンがウェブページをランク付けする方法の一部が詳細に記載されている。
(そのコードを元に公開されたWebサイト)
この情報はSEOコミュニティにとって驚きであり、過去にGoogleが提供した情報と矛盾する部分も含まれている。
公開されたドキュメントの内容
- 技術文書の詳細: 公開されたドキュメントには、Googleの「ContentWarehouse」に関するAPIドキュメントが含まれている。これには2,596のモジュールと14,014の属性が記載されており、検索エンジンのランク付けアルゴリズムの複雑さが示されている。
- クリック率の影響: ドキュメントによると、検索結果のクリック率(CTR)がランク付けに影響を与えることが示されている。これはGoogleが過去に否定していたものであり、「Navboost」というシステムがこれを実現している。
- ホワイトリスト: 特定のトピックに関して、特定のウェブサイトを人工的に優遇するホワイトリストが存在することも示されている。例として「isElectionAuthority」と「isCovidLocalAuthority」が挙げられている。
- サイトと著者の権威: サイトには「SiteAuthority」という値があり、著名なサイトは高く評価される。また、著者にも独自のランキングが存在する。
コードサンプルと画像
// Navboostシステムの例
const navboost = (url) => {
// クリックデータに基づくブースト処理
};
影響と懸念
SEO専門家たちは、このドキュメントによりGoogleが過去に彼らに「嘘をついていた」と非難している。具体的には、 CTRがランク付けに影響を与えるという事実が明らかになった ことが挙げられている。
このドキュメント公開により、検索エンジンの操作が容易になる可能性がある。例えば、CTRがランク付けに影響を与えることを知った人々がクリックファームを利用して特定のウェブサイトのランクを上げることが懸念される。この事件が今後のWebにどのような影響をもたらすのか、引き続き注視が必要だ。