コンテンツの言語、拒否されたドキュメントの処理方法およびコンテンツ・クローラ・タグを指定します。
「コンテンツの言語」のドロップダウン・リストから、インポートするコンテンツで頻繁に使用されている言語を選択します。
「拒否されたドキュメント」で、フォルダにソートされなかったドキュメントの処理方法を指定します。
拒否されたドキュメントを強制的にインポートするには、「未分類ドキュメント・フォルダにインポートする」を選択します。
注意: 未分類ドキュメント・フォルダは、未分類ドキュメントへのアクセス権限が与えられているユーザーが使用できます。未分類ドキュメントにアクセスするには、「ディレクトリ」メニューの「ディレクトリの編集」をクリックして、未分類ドキュメントフォルダを開きます。「管理」 →「ユーティリティの選択」→「未分類ドキュメントへのアクセス」をクリックして開くこともできます。
拒否されたドキュメントをインポートしないようにするには、「インポートしない」を選択します。
既存のコンテンツ・クローラを編集している場合は、「拒否されたドキュメント」に、このコンテンツ・クローラが以前に拒否されたドキュメントを検出したときにどのように処理するかを指定できる追加オプションが表示されます。以前に拒否されたドキュメントの定義は、手順4bで選択したオプションによって異なります。
「このコンテンツ・クローラ」を選択した場合は、以前に拒否されたドキュメントには、このコンテンツ・クローラによって拒否されたすべてのドキュメントが含まれます。
「このコンテンツ・ソース」を選択した場合は、以前に拒否されたドキュメントには、このコンテンツ・ソースによって拒否されたすべてのドキュメントが含まれます。
以前に拒否されたドキュメントをどのように処理するかを指定します。
以前に拒否されたドキュメントを同じコンテンツ・クローラによってインポートするには、「再インポート」チェック・ボックスを選択します。
拒否されたドキュメントをインポートしないようにするには、「インポートしない」を選択します。
どうしても必要な場合は、以前に拒否されたドキュメントの履歴を削除できます。この場合、以前に拒否されたドキュメントの定義は、手順4bで選択したオプションによって異なります。手順4bで「このコンテンツ・ソース」を選択した場合、このコンテンツ・ソースからドキュメントをインポートするすべてのコンテンツ・クローラの拒否履歴が削除されます。以前に拒否されたドキュメントの履歴を削除するには、「拒否履歴のクリア」をクリックします。
注意:ドキュメントがどのフォルダにも分類されず、未分類ドキュメント・フォルダに格納された場合、そのドキュメントは拒否されたものとしてみなされません。拒否されたドキュメントとは、どのフォルダにも格納されないドキュメントを指します。
既存のコンテンツ・クローラを編集している場合は、「ドキュメントのインポート」セクションが表示されます。「ドキュメントのインポート」で、新規ドキュメントのみがインポートされるようにするかどうかを指定します。デフォルトでは、コンテンツ・クローラによって(このコンテンツ・クローラ、あるいは同じコンテンツ・ソースにアクセスする他のコンテンツ・クローラによってこれまでにインポートされたことがない)新規のドキュメントのみがインポートされます。各ドキュメントが複数のコピーをインポートするようにコンテンツ・クローラの設定を変更できるため、コンテンツ・クローラのテスト時に役立ちます。
新規ドキュメントのみをインポートするには、「新規リンクのみをインポートする」チェック・ボックスを選択して、新規オプションを表示します。このようなインポートを行わない場合は、手順5に進みます。
新規リンクの定義を指定するには、次の操作を実行します。
このコンテンツ・クローラによって、これまでにインポートされたことがないドキュメントのみをインポートするには、「このコンテンツ・クローラ」オプションをオンにします。
関連するコンテンツ・ソースから、同じコンテンツ・クローラ、別のコンテンツ・クローラまたはユーザーの手動によってこれまでにインポートされたことがないドキュメントのみをインポートするには、「このコンテンツ・ソース」オプションをオンにします。
注意:ここで選択したオプションは、手順3および手順4fの操作に影響します。
これまでにインポートされたドキュメントをドキュメント設定ページの設定内容でリフレッシュするには、「リフレッシュする」オプションをオンにします。通常、ドキュメントの更新はドキュメント・リフレッシュ・エージェントによって処理されるジョブであるため、ドキュメントをリフレッシュすると、コンテンツ・クローラの処理速度が遅くなります。ただし、このコンテンツ・クローラのドキュメント設定を変更したり、関連するコンテンツ・タイプ内のプロパティ・マップを変更した場合は、ドキュメントを更新すると、これまでにインポートされたドキュメント設定も更新されます。
注意: RSSフィードをクロールしている場合、「リフレッシュする」オプションを使用すると、RSSフィードではなく、ターゲット・ドキュメントの値でプロパティ(タイトルや説明など)がリフレッシュされます。RSSフィードのプロパティを保持する場合は、「リフレッシュする」を選択しないでください。
追加フォルダを作成したり、別のフィルタを宛先フォルダに適用した場合は、「これらのドキュメントを追加のフォルダでソートする」チェック・ボックスを選択して、これまでにインポートされたドキュメントを新規のナレッジ・ディレクトリ・フォルダにソートします。
別のコンテンツ・クローラによって同じコンテンツ・ソースからドキュメントがインポートされ、このコンテンツ・クローラに指定された宛先フォルダ以外のフォルダに保存されることがあります。ドキュメントを再ソートして、このコンテンツ・クローラに指定された宛先フォルダに格納する必要があるかどうかを確認してください。
(手動による操作、期限切れ、またはソース・ドキュメントの喪失などの理由により)これまでに削除されたドキュメントを再インポートするには、「削除されたリンクを再生成する」オプションを選択します。これにより、ポータルで不要とみなされたドキュメントを再インポートできるようになることがあります。
どうしても必要な場合は、ポータルからすでに削除されたドキュメントに関する履歴を削除できます。「履歴」は、手順3bで新規ドキュメントとして指定したときの内容で定義されます。
「このコンテンツ・クローラ」を選択した場合、履歴には、このコンテンツ・クローラによってインポートされ、削除されたすべてのドキュメントが含まれます。
「このコンテンツ・ソース」を選択した場合、履歴には、このコンテンツ・ソースによってインポートされ、削除されたすべてのドキュメントが含まれます。したがって、このコンテンツ・ソースからドキュメントをインポートするすべてのコンテンツ・クローラの履歴が削除されることになります。
ポータルから削除されたドキュメントに関するレコードを削除するには、「削除履歴のクリア」をクリックします。
インポート済のドキュメントにコンテンツ・クローラ・タグのマークを付けるには、「インポートされたドキュメントを次のコンテンツ・クローラ・タグでマーク」ボックスにタグを入力します。このタグは、このコンテンツ・クローラによってインポートされたドキュメントと別のコンテンツ・クローラによってインポートされたドキュメントを区別するために使用されます。
「ランタイムの構成」で、下記を設定します。
ドキュメント取得の最大スレッド数コンテンツ・ソースからのコンテンツの取得に使用されるスレッドについて、同時に実行できる最大数を指定します。
カード索引作成の最大スレッド数コンテンツがポータルに取り込まれた後、コンテンツの処理に使用されるスレッドについて、同時に実行できる最大数を指定します。
これらのフィールドに入力できる範囲は、ポータル構成ファイルで設定できます。ここで設定される値は、このコンテンツ・クローラに関連するジョブで使用される自動化サービスの最大スレッド数によっても制限されます。
このヘルプ・トピックに関連するページを表示するには: