Webページの除外

不必要なWebページをポータルにインポートしないようにこのコンテンツ・クローラを構成するには:

  1. デフォルトでは、このコンテンツ・クローラは、自動クロールの設定が推奨されるページについて、Webサーバーの推奨値に従います。この推奨値以外の値を使用するには、「目的のサイトのロボット排除プロトコルに従う」チェック・ボックスの選択を解除します。

    一般に、このような推奨値を設定することで、不要なコンテンツがポータルに取り込まれないようにできます。ただし、一部のサイトでは厳密な推奨値が設定されています。クローラがサイトからコンテンツをインポートしない場合は、このオプションの選択を解除してください。

  2. デフォルトでは、このコンテンツ・クローラはWebサイトのソースで使用される場合、インポートされたWebページのURLを保存します。URLを小文字に変換するには、「すべてのURLを小文字に変換」を選択します。

  3. あるWebサイトのエリアからコンテンツをインポートしないようにする、または特定のページをインポートしないようにするには:

  4. デフォルトで、このコンテンツ・クローラは除外で指定されたページをクロールまたはインポートしません。コンテンツ・クローラで、除外されたページのリンクから、除外されておらず、ページをインポートする必要があるページを選択する場合は、「除外されたページをクロールするが、インポートしない」を選択します。

  5. クロールの対象をあるWebサイトのエリアまたは特定のページに制限するには:


  1. 「管理」をクリックします
  2. コンテンツ・クローラのエディタを開きます。
  3. 左側にある「オブジェクト設定の編集」で、「Webページの除外」をクリックします。