Home > ドキュメント | ユーザーマニュアル > 入力文書選択モジュールの実装

入力文書選択モジュールの実装

  • 2008-05-28 (水) 23:40

図1 に入力文書選択パネルを示す.入力文書選択パネルでは,領域に関連する英語または日本語で記述された文書を選択する.入力文書選択パネルでは,xdoc2txt というツールを用いて,様々な形式(Word, Excel, PowerPoint, PDF など)のファイルからテキストデータを抽出できる.単語を抽出する際には,抽出する単語の品詞を指定できるようにしている.名詞,動詞,その他の品詞,複合語のいずれかを抽出したり,1 文字だけの領域オントロジー構築に不要となる語を除去することができる.以下に図1 の各部分について説明する.

図1: 入力文書選択パネル
  1. 入力文書のリストを表示する.
  2. 入力文書の記述言語(日本語または英語)の選択と入力文書の追加および削除を行う.
  3. 1 文の区切り文字を設定する.
  4. (1) の入力文書リストの中から選択された文書の内容を表示する.
  5. 抽出する語の品詞,複合語を抽出するかどうか,1 文字の語を抽出するかどうかを選択する.
  6. (1) の入力文書リストで選択された文書中から(5) で指定した条件の語を抽出する.

Home > ドキュメント | ユーザーマニュアル > 入力文書選択モジュールの実装

Search
Feeds
Meta

Return to page top