私も最近ちらほら利用させてもらっている生成AI。きちんと質問しないと「え?」っていう答えが返ってきたりするので、決して鵜呑みにはできないというのが現状での印象ではあるものの、正解のコンテンツの学習を続けていけばそのうちターミネーター?みたいな世界がやってくるかも知れませんね。
さて、今回はそんな便利なAIに、自身のコンテンツは学習されないようにしてみようというのがテーマです。
調べてみたところ、OpenAI社の「ChatGPT」、Google社の「Gemini(旧Bard)」、Common Crawlという非営利団体の「CCBot」あたりが、現在では主要なAIボットのようですから、AIからの情報収集をWordPressで防ぐ方法として紹介します。
WordPressはインストールして何もしていなければ、どこにもrobots.txtというファイルを持っておらず、自動で生成される仕組みになっています。
具体的には下図のように「設定」→「表示設定」を開き、一番下にある「robots.txtの追加ルール」という項目へ追記するだけで反映されるようになっていて、特にプラグインを使用したり、特殊なコードを書かなくても設定できますから、特に自前でrobots.txtをサイトへ追加することは原則必要ありません。
ちなみに赤枠で囲んである「robots.txt」というリンクをクリックすると、動的に出力されているrobots.txtの内容が確認できます。
逆に、もう既にサイトのルートディレクトリにrobots.txtがある場合はそちらへ追記しないと反映されない、もしくは動作がおかしくなることがありますから、必ず確認してください

以下がそれぞれのAIクローラーに対する拒否設定のコードなので、必要に応じて追加・削除すれば即反映されます(必ずrobots.txtリンクをクリックして最終確認してください)。
User-agent: GPTBot
Disallow: /
User-agent: ChatGPT-User
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: CCBot
Disallow: /
一応Googleでは、GoogleのAIボットからのデータ収集を拒否しても検索順位などに影響はないとしていますが、本当のところどうなのかは全く分かりませんから、自己責任で追加はしてくださいね。
当サイトでは2024年4月19日に上記コードを追加して様子を見ている状況です。まあ特に学習に足るようなコンテンツではないのでブロックする意味はないんですけどね(笑)。何事も試行が大切ということで..。
コメントを残す