- 2008-05-28 (水) 23:59
DODDLE-OWL Beta2のユーザマニュアルです.
目次
- システムフロー
- 起動
- 新規プロジェクト
- 入力文書選択
- 入力単語選択
- オントロジー選択
- 多義性解消
- 概念階層構築
- 概念階層洗練
- クラス階層構築パネル
- 概念定義
- 概念定義パネル
- 視覚化モジュール
- 領域オントロジーの保存
- プロジェクトの保存と復元
- DODDLE-OWLの終了
- オプションダイアログ
- メニューとツールバー
- 参考文献
システムフロー

図1: DODDLE-OWLのシステムフロー
図1にDODDLE-OWLのシステムフローを示す.DODDLE-OWLは,入力モジュール,オントロジー選択モジュール,オントロジー 構築モジュー ル,オントロジー洗練モジュール,視覚化モジュール,変換モジュールの主に6つのモジュールから構成される.DODDLE-OWLでは1つ以上の領域にお ける専門文書があることを前提としている.また,ユーザは領域にとって重要な単語を選択可能な知識をもっているものとする.はじめに,入力モジュールにお いて,ユーザは領域にとって重要な概念(入力概念)を選択する.次にユーザはオントロジー選択モジュールにおいて,参照オントロジー(汎用オントロジーま たは既存OWLオントロジー)を選択する.オントロジー構築モジュールでは,参照オントロジー,入力概念,専門文書を参照しながら,初期概念階層と概念対 を得る.次にオントロジー洗練モジュールではオントロジー構築モジュールで半自動構築した初期オントロジーをユーザとのインタラクションを通して洗練す る.その際に視覚化モジュールによって,視覚的にオントロジーを洗練することができる.最後に,OWL(Web Ontology Language) [1]形式で領域オントロジーを出力する.
汎用オントロジー
DODDLE-OWLでは,汎用オントロジーとしてWordNet, EDR電子化辞書(一般辞書および専門辞書)を利用可能である.以下では簡単にそれぞれの汎用オントロジーについて説明する.
EDR電子化辞書
EDR電子化辞書 [2]は, 独立行政法人 情報通信研究機構が提供している汎用オントロジーである.EDR電子化辞書は,日本語単語辞書,英語単語辞書,概念辞書,日英対訳辞書,英日対訳辞書,日 本語共起辞書,英語共起辞書,日本語コーパス,英語コーパス,専門用語辞書(情報処理)から構成される.DODDLE-OWLでは,これらの辞書の中か ら,日本語単語辞書,英語単語辞書,概念辞書,専門用語辞書(情報処理)を利用している.
WordNet
WordNet [3]は, プリンストン大学で開発されている英語シソーラス(汎用オントロジー)である.名詞句辞書,動詞句辞書,形容詞句辞書,副詞句辞書,および見出し句辞書か ら構成されており,総計約10万の語彙を保持している.見出し句辞書は,見出し句,意味情報としての概念ID,辞書編集情報,品詞情報などから構成されて いるが,概念IDが,見出し句辞書と各辞書の間のリンクとして機能している.名詞句辞書と動詞句辞書は,概念ID,辞書編集情報,対応する見出し句リスト から構成されているが,概念群は階層構造を有している.また,一部の概念IDには,反対概念の概念ID,part ofやmember ofやsubstance ofの概念IDなども与えられている.形容詞句辞書と副詞句辞書も,概念ID,辞書編集情報,対応する見出し句リストから構成されているが,階層構造は持 たない.
起動

図2: DODDLE-OWLの起動画面
DODDLE-OWLを起動すると,図2中央にあるようなスプラッシュウィンドウが表示される.スプラッシュウィンドウ表示中に初期化が行われる.初期化終了後に起動画面が表示される.
新規プロジェクト

図3: 新規プロジェクト
図3に示すように,メニューの「ファイル」→「新規プロジェクト」を選択する.
入力文書選択

図4: 入力文書選択パネル
領域に関連する英語ま たは日本語で記述された文書を選択する.DODDLE-OWLでは,xdoc2txtというツールを用いて,様々な形式 (Word, Excel, PowerPoint, PDFなど)のファイルからテキストデータを抽出可能にしている.単語を抽出する際には,抽出する単語の品詞を指定できるようにしている.名詞,動詞,複 合語のいずれかを抽出したり,1文字だけの領域オントロジー構築に不要となる単語を除去することができる. 図4に入力文書選択パネルを示す.(1)では,領域に関連のある文書を選択する.(2)において,日本語文書(ja)か英語文書(en)かを選択す る.ある程度の精度で,自動的に日本語か英語かを判別するようにはなっている.(3)は,(1)の入力文書リストの中から選択された文書の内容を表示す る.(4)では,抽出する単語の品詞をチェックボックスより選択する.(5)の単語抽出ボタンを押すことにより,(1)で選択された文書中から(4)で指 定した品詞の単語を抽出する.
入力単語選択

図5: 入力単語選択パネル: 正解単語テーブル

図6: 入力単語選択パネル: 削除単語テーブル

図7: 入力単語選択パネル: 入力文書ビューア
図5から図7に入力単 語選択パネルを示す.入力単語選択パネルでは,入力文書選択パネルで選択した文書から抽出された単語が,図5(2)の入力単語 テーブルに表示される.入力単語テーブルでは,単語,品詞,TF,IDF,TF-IDFを基準にソートを行うことができる.図5(2)より領域にとって重 要な単語を選択し,図5(5)の「入力単語リストに追加」ボタンを押すと,図5(3)の入力単語リストに単語が追加される.入力単語リストはテキストエリ アとなっており,直接編集することも可能である.図5(3)には,抽出に失敗した単語や文書中には存在しない領域にとって重要な単語などを追加することが できる.図5(7)の「入力語彙をセット」ボタンを押すことで,入力語彙が決定する.すでに入力語彙を決定しており,入力語彙をさらに追加したい場合に は,「入力語彙を追加」ボタンを押す.注意点として,入力語彙を決定する前に,参照オントロジーを選択しておく必要がある. 図5(1)の単語フィルターと品詞フィルターは,特定の単語または品詞を含む行のみを図5(2)の入力単語テーブルに表示する.図5(4)の正解単語テー ブル,削除単語テーブル,入力文書ビューアの各タブはそれぞれ以下の情報を表示する.「正解単語テーブル」タブは,入力単語の候補となる単語を表示するた めのタブである.「削除単語テーブル」タブは,「正解単語テーブル」タブの入力単語テーブルから図5(6)の「削除」ボタンを押して削除された単語が表示 される.「入力文書ビューア」タブは,出現頻度により文書中の抽出単語をハイライトしたものが表示される.図6と図7に「削除単語テーブル」タブと「入力 文書ビューア」タブを示す.図6左下の「戻す」ボタンで,誤って削除した単語を「正解単語テーブル」タブに戻すことができる.図7左下の「再読込」ボタン で,図7上部の入力文書リストで選択された文書の内容を「入力文書」テキストエリアに表示する.正解単語テーブルにある単語は青色で,削除単語テーブルに ある単語は灰色で表示される.また,出現頻度の高い単語ほどフォントサイズが大きく表示される.現状では,表示速度が遅いため,文書量が多い場合にはうま く機能しないことがある. 入力単語リストは以下のように一行一単語の形式で記述されたファイル(UTF-8形式)から読み込むことも可能である.以下では,改行を「¥n」記号で明 示的に示している.
入力単語 1¥n 入力単語 2¥n 入力単語 3¥n ... 入力単語 N¥n
入力単語リストをファイルから読み込むためには,「ファイル→開く→入力単語リストを開く」メニューを選択する.「入力単語リストを開く」メニュー を選択すると,ファイルを選択するためのダイアログが表示される.ここで,入力単語リストが保存されたファイルを選択すると,図5(7)の「入力語彙を セット」ボタンを押して,入力単語を決定した状態となる.
オントロジー選択

図8: オントロジー選択パネル: 汎用オントロジー選択

図9: オントロジー選択パネル: OWLオントロジー選択
図8(1)に示 す,EDR一般辞書,EDR専門辞書,WordNetの中から参照する汎用オントロジーを選択する.チェックボックスにチェックをつ けた汎用オントロジーを用いて,その後領域オントロジーにおける概念階層を構築する.複数の汎用オントロジーが選択可能な利点としては,領域によっては, 一つの汎用オントロジーだけでは語彙をカバーしきれない場合があるため,複数を組み合わせて利用できるようにしている. 図8(2)の名前空間テーブルは,名前空間とその接頭辞の対応関係を管理している.図9に示したOWLオントロジー選択において,クラスやプロパ ティの名前空間をDODDLE-OWL上で省略して表示するために用いる.図8(3)に接頭辞と名前空間を入力し,図8(3)右側の「追加」ボタンで追加 することができる. 図8(4)の「汎用オントロジー選択,名前空間テーブル」タブと「OWLオントロジー選択」タブは,それぞれ以下の情報を表示する.「汎用オントロ ジー選択,名前空間テーブル」タブは,上記に示したように,汎用オントロジーの選択と名前空間と接頭辞の対応関係の管理を行う.「OWLオントロジー選 択」タブは,既存のOWLオントロジーを参照オントロジーとして利用できるように,既存OWLオントロジーの登録を行う. 図9に「OWLオントロジー選択」タブを示す.図9(1)の「追加(ファイル)」または「追加(URI)」ボタンにより,参照オントロジーとする既 存OWLオントロジーを選択する.図9(3)には,図9(1)のオントロジーリスト中で選択したオントロジーのOWLメタデータが表示される.また,図9 (2)において,OWLオントロジー中から抽出する要素を決定するためのテンプレートを指定する.テンプレートの詳細については,以下の「OWLオントロ ジーからの要素抽出」で述べる.
OWLオントロジーからの要素抽出
OWLオントロジーを参照オントロジーとして領域オントロジー構築支援で利用するためには,オントロジー構築支援に利用可能な要素をOWLオントロ ジーから抽出する必要がある.DODDLE-OWLでは,領域オントロジーにおける階層関係および非階層関係の定義を支援している.概念関係および非階層 関係を定義するために必要なOWLオントロジーの要素は,概念(クラス及びプロパティ),概念の見出し,概念の説明,上位・下位関係,非階層関係である. 概念の抽出は,領域オントロジー構築において必須である.概念の見出しは,入力単語と概念を対応づける(入力概念選択)ために必要である.概念の説明は, 入力単語に対応する概念が複数ある場合に,入力概念をユーザが選択する際の参考となる.上位・下位関係はクラス及びプロパティ階層を構築する際に必要であ る.非階層関係を定義するために,プロパティの定義域および値域などを抽出する必要がある. RDFS, DAML, OWLなどのオントロジー記述言語は,上記のオントロジーの要素を定義するために基本的なクラスやプロパティを提供している.例えば,オントロジー検索エ ンジンSwoogle [4]では,RDFS, DAML, OWLが提供している基本的なクラス及びプロパティに基づいて,オントロジーの検索を行うことができるようになっている.Swoogleではクラスを,次の(X, Y, Z)というStatementを満たすXと定義している.
- X: 匿名以外のリソース
- Y: rdf:type
- Z: rdfs:Class, owl:Class, owl:Restriction, owl:DataRange, daml:Class, daml:Datatype, daml:Restrictionのいずれか
Swoogleが扱う範囲のクラスやプロパティのみをOWLオントロジーから抽出する場合には,Swoogleの定義に従ってオントロジーの要素を抽出すればよい.しかし,それ以外の形式で定義された汎用オントロジーやシソーラスが存在する. WordNet RDF/OWLや[5]ではWordNetやEDRのOWL化について検討しており,Swoogleで定義しているクラスやプロパティとは構造が異なっている.[6]では,Wikipediaに対してWebマイニングを行う手法であるWikipediaマイニングを提案し,シソーラス辞書を構築している.構築されたWikipediaシソーラスをOWL形式で表現するための語彙として,SKOS (Simple Knowledge Organisation System)を用いている.SKOSでは,概念を表すクラスとしてskos:Concept,上位概念を表すプロパティとしてskos:broaderな どが定義されており,OWL基本語彙とは異なっている.図にOWL基本語彙及びWordNetRDF/OWLにおける概念の見出しを示す.表1にOWL基 本語彙,SKOS, WordNet RDF/OWL, EDR RDF/OWLにおけるオントロジーの要素を特定するクラス及びプロパティを示す.

図: OWL基本語彙およびWordNet RDF/OWLにおける概念の見出し
表1: OWL基本語彙,SKOS, WordNet RDF/OWL, EDR RDF/OWLにおけるオントロジーの要素を特定するクラス及びプロパティ.
| オントロジーの要素 | オントロジーの要素を特定するクラス及びプロパティ |
|---|---|
| 概念 | rdfs:Class, owl:Class, rdf:Property, owl:ObjectProperty, owl:DatatypeProperty skos:Concept wn20schema:WordSense, wn20schema:NounWordSense など edrschema:概念 |
| 見出し | rdfs:label skos:prefLabel, skos:altLabel, skos:hiddenLabel wn20schema:lexicalForm edrschema:日本語概念見出し, edrschema:英語概念見出し |
| 説明 | rdfs:comment skos:definition wn20schema:gloss edrschema:日本語概念説明, edrschema:英語概念説明 |
| 上位・下位関係 | rdfs:subClassOf, rdfs:subPropertyOf skos:broader, skos:narrower wn20schema:hypernymOf, wn20schema:hyponymOf edrschema:上位概念, edrschema:下位概念 |
| 非階層関係 | rdfs:domain, rdfs:range skos:related wn20schema:antonymOf, wn20schema:partMeronymOf など edrschema:agent, edrschema:object |
表1では,接頭辞 rdf,rdfs,owl,skos,wn20schema,edrschemaは以下の名前空間を表している.
- rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#
- rdfs: http://www.w3.org/2000/01/rdf-schema#
- owl: http://www.w3.org/2002/07/owl#
- skos: http://www.w3.org/2004/02/skos/core#
- wn20schema: http://www.w3.org/2006/03/wn/wn20/schema/
- edrschema: http://www-kasm.nii.ac.jp/ontologies/edr/Schema
DODDLE-OWLでは,多用な形式のオントロジーからオントロジーの要素を抽出するために,クラス抽出テンプレート,プロパティ抽出テンプレー ト,見出しと説明抽出テンプレート,上位・下位関係抽出テンプレート,非階層関係抽出テンプレートの5種類のテンプレートをRDFクエリー言語 SPARQLを 用いて記述し,OWLオントロジーと対応づけている.ソースコード1から5にOWL語彙におけるオントロジーの要素を抽出するためのSPARQLで記述し たテンプレートを示す. ソースコード3の見出し・説明抽出テンプレートを直接SPARQLのクエリーとした場合,OWLオントロジー中のすべてのrdfs:labelとrdfs:commentプロパティの値を抽出してしまう.DODDLE-OWLは?conceptの 部分を取得したい概念(クラスまたはプロパティ)のURIに置換することで,特定の概念の見出し及び説明のみを抽出できるようにしている.他のテンプレー トも同様にテンプレートを直接SPARQLのクエリーとして用いるのではなく,変数部分をDODDLE-OWLプログラム中で適切なURIに置換したもの を最終的なSPARQLのクエリーとしている.?concept, ?subConcept, ?class, ?property, ?label, ?description, ?domain, ?range変数を用いてトリプルのパターンを各オントロジーの要素を抽出するテンプレートに記述し,テンプレートをOWLオントロジーに対応づけることで,様々なクラス,プロパティ,構造により表現されたオントロジーの要素を抽出することが可能となる.
ソースコード1: クラス抽出テンプレート
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX daml03: <http://www.daml.org/2001/03/daml+oil#>
PREFIX daml10: <http://www.w3.org/2001/10/daml+oil#>
SELECT ?class WHERE {
{?class rdf:type rdfs:Class} UNION {?class rdf:type owl:Class} UNION
{?class rdf:type owl:Restriction} UNION {?class rdf:type owl:DataRange} UNION
{?class rdf:type daml03:Class} UNION {?class rdf:type daml03:Datatype} UNION
{?class rdf:type daml03:Restriction} UNION {?class rdf:type daml10:Class} UNION
{?class rdf:type daml10:Datatype} UNION {?class rdf:type daml10:Restriction}
}
ソースコード2: プロパティ抽出テンプレート
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX daml03: <http://www.daml.org/2001/03/daml+oil#>
PREFIX daml10: <http://www.w3.org/2001/10/daml+oil#>
SELECT ?property WHERE {
{?property rdf:type rdf:Property} UNION {?property rdf:type owl:ObjectProperty} UNION
{?property rdf:type owl:DatatypeProperty} UNION {?property rdf:type owl:AnnotationProperty} UNION
{?property rdf:type owl:FunctionalProperty} UNION {?property rdf:type owl:InverseFunctionalProperty} UNION
{?property rdf:type owl:SymmetricProperty} UNION {?property rdf:type owl:OntologyProperty} UNION
{?property rdf:type owl:TransitiveProperty} UNION {?property rdf:type daml03:Property} UNION
{?property rdf:type daml03:ObjectProperty} UNION {?property rdf:type daml03:DatatypeProperty} UNION
{?property rdf:type daml03:TransitiveProperty} UNION {?property rdf:type daml03:DatatypeProperty} UNION
{?property rdf:type daml03:UniqueProperty} UNION {?property rdf:type daml10:Property} UNION
{?property rdf:type daml10:ObjectProperty} UNION {?property rdf:type daml10:DatatypeProperty} UNION
{?property rdf:type daml10:TransitiveProperty} UNION {?property rdf:type daml10:DatatypeProperty} UNION
{?property rdf:type daml10:UniqueProperty}
}
ソースコード3: 見出し・説明抽出テンプレート
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX daml03: <http://www.daml.org/2001/03/daml+oil#>
PREFIX daml10: <http://www.w3.org/2001/10/daml+oil#>
SELECT ?label ?description WHERE {
{?concept rdfs:label ?label} UNION {?concept rdfs:comment ?description} UNION
{?concept daml03:label ?label} UNION {?concept daml03:comment ?description} UNION
{?concept daml10:label ?label} UNION {?concept daml10:comment ?description}
}
ソースコード4: 上位・下位関係抽出テンプレート
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX daml03: <http://www.daml.org/2001/03/daml+oil#>
PREFIX daml10: <http://www.w3.org/2001/10/daml+oil#>
SELECT ?subConcept WHERE {
{?subConcept rdfs:subClassOf ?concept} UNION {?subConcept rdfs:subPropertyOf ?concept} UNION
{?subConcept daml03:subClassOf ?concept} UNION {?subConcept daml03:subPropertyOf ?concept} UNION
{?subConcept daml10:subClassOf ?concept} UNION {?subConcept daml10:subPropertyOf ?concept}
}
ソースコード5: 定義域・値域抽出テンプレート
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX daml03: <http://www.daml.org/2001/03/daml+oil#>
PREFIX daml10: <http://www.w3.org/2001/10/daml+oil#>
SELECT ?property ?domain ?range WHERE {
{?property rdfs:domain ?domain} UNION {?property rdfs:range ?range} UNION
{?property daml03:domain ?domain} UNION {?property daml03:range ?range} UNION
{?property daml10:domain ?domain} UNION {?property daml10:range ?range}
}
多義性解消

図10: 多義性解消パネル
図10に多義性解消パ ネルを示す.多義性解消パネルでは,入力単語と参照オントロジー中の概念との対応付けを行う.単語には多義性があり,同じ字面で出現 していても文脈によって異なる概念をあらわす場合がある.そのため,入力単語を参照オントロジー中の概念と対応づける場合,単語の意味を一意に特定する必 要がある.以下に多義性解消パネルのの各部分の説明を示す.
- 図10(1) 単語リスト
- 入力単語集合の中で参照オントロジー中の概念見出しと完全照合または部分照合した単語リスト
- 図10(2) 概念リスト
- 完全照合または部分照合単語リストの中で選択された単語を表記としてもつ参照オントロジー中の概念リスト
- 図10(3) 概念情報
- 概念リストの中から選択された概念の見出しおよび説明.それぞれ,言語を切り替えることができる.
- 図10(4) 未定義単語リスト
- 入力単語集合の中で参照オントロジー中の概念の表記に含まれない単語リスト.
- 図10(5) 概念階層
- 選択されている概念リスト中の概念の参照オントロジー中の階層構造を表示.
- 図10(6) 入力文書
- 選択されている入力単語の文書中の出現場所をハイライト表示.
- 図10(7) 階層構築オプション
- 階層構築における,剪定の有無,複合語階層の構築をするかどうかの選択を行う.
入力単語と参照オントロジー中の概念との対応付けは,図10(1)の単語リストを一つずつ選択し,選択した単語を見出しに含む概念が複数ある場合に は,概念の説明を参照しながら,最も適切な概念をユーザは選択していく.概念を選択することによって,入力単語と概念の対応付けが行われる. 多くの複合語は,それを表記として持つ概念が参照オントロジー中に存在しない.DODDLE-OWLでは,部分照合を行うことによって,多くの複合 語の多義性解消を可能にしている.DODDLE-OWLの多義性解消方法は完全照合と部分照合の2種類がある.完全照合は,入力単語と参照オントロジー中 の概念が持つ表記が完全に一致することを意味する.部分照合は,入力単語と参照オントロジー中の概念が持つ表記が部分的に一致することを意味する.完全照 合しなかった入力単語については,形態素解析を行う.語尾の形態素から語頭の形態素まで順番に参照オントロジー中の概念と照合していき,最長一致する概念 集合を多義性解消候補として提示する.ある参照オントロジーでは部分照合する概念しか存在せず,もう一つの参照オントロジーでは完全照合する概念が存在す る場合には,完全照合する概念を優先する. 例えば,「ロケット発射装置」という入力単語について多義性解消を行い,完全照合しなかった場合,形態素解析を行い,「ロケット」と「発射」と「装 置」に分解する.はじめに,末尾の単語「装置」について照合を行い,次に「発射装置」について照合を行う.この例では,「発射装置」を表記としてもつ概念 は参照オントロジー中に存在せず,「装置」を表記として持つ概念が参照オントロジー中に存在する.よって,「装置」を表記として持つ概念を候補として提示 する. 部分照合した複合語については,階層構築時に対応する概念の下位概念に その複合語を表記としてもつ概念を挿入(作成)する.照合しなかった入力単 語と照合はしたが,適切な概念が存在しない入力単語は,未知語となる.未知語は構築モジュールで初期階層構築後に,洗練モジュールで階層中の適切な位置に ユーザが手動で挿入する. 以下では,図10(1), (2), (3), (7)について詳述する.
多義性解消パネル: 単語リスト

図11: 多義性解消パネル: 単語リスト
図11は図 10(1)を拡大した図である.図11(1)に検索キーワードを入力し,検索ボタンを押すと,図11(2)及び(3)の完全照合および部 分照合単語リストに検索キーワードを含む単語が表示される.図11(2)は完全照合単語リストを表示する.図11(3)は部分照合単語リストを表示する. 図11(4)は,完全照合単語リストに対するオプションをチェックボックスで設定できる.図11(4)の「意味数」は,完全照合単語リスト中の各単語を表 記としてもつ参照オントロジー中の概念数を表示するかどうかを設定するオプションである.図11(4)の「システムが追加した単語」は,部分照合した単語 の中で参照オントロジー中の概念の見出しとして存在する単語を,ユーザが入力単語として追加していなかった場合に,システムが自動的に完全照合単語として 追加する単語をあらわす.例えば,「letter book」という単語をユーザが入力単語とした時に,「letter book」自体は参照オントロジー中の概念の見出しに存在しないため,部分照合単語となる.この例では,「letter book」の「book」に対して部分照合したとする.ここで,ユーザが「letter book」に加えて,「book」も入力単語としていた場合には問題ない.しかし,「book」をユーザが入力単語としなかった場合には,「book」を 「システムが追加した完全照合単語」として,完全照合単語リストに追加する.システムが追加した単語には,「(added)」と表示される.図11(4) の「システムが追加した単語」チェックボックスのチェックの有無により,「(added)」の表示が切り替わる.図11(4)の「多義性解消結果を対応す る部分照合単語リストに適用」は,完全照合単語リストに対する多義性解消結果を選択した完全照合単語で照合した部分照合単語リストの多義性解消結果に反映 させるかどうかを設定するためのオプションである.例えば,図11の例では,完全照合単語リスト中の「fee」に対して多義性解消を行った結果を,部分照 合単語リスト中の「membership fee」と「annual fee」の両方にも反映させるかどうかを設定することができる. 図11(5)は,部分照合単語リストの表示方法におけるオプションをチェックボックスで設定できる.図11(5)の「意味数」は図11(4)の完全 照合単語リストのオプションにおける「意味数」と同様である.図11(5)の「複合語」は,部分照合単語を形態素解析器で形態素に分割した時の分割のされ 方を表示するか否かを設定するためのオプションである.例えば,図11(5)の「複合語」チェックボックスにチェックを入れた場合,「postal address」は,「(postal+address)」といったように,形態素の区切りを「+」記号で表示する.図11(5)の「照合結果」は,部分 照合単語の形態素リストの中で,参照オントロジー中の概念と照合した形態素リストを表示するか否かを設定するオプションである.例えば,図11(5)の 「照合結果」チェックボックスにチェックを入れた場合,「postal address」は,「address」で照合しているので,「(address)」と表示される.図11(5)の「選択中の完全照合単語に対応する複合 語のみ表示」は,完全照合単語リストで選択した単語を照合単語とする部分照合単語のみを表示するか否かを設定するためのオプションである.例えば,このオ プションにチェックをいれた状態で,図11(2)の「fee」を選択した場合,「fee」を照合単語とする「membership fee」と「annual fee」のみが図11(3)に表示される.図11(6)は,入力単語選択パネルで追加し忘れた単語をテキストフィールドに入力し,「追加」ボタンを押すこ とにより図11(2)(3)のリストに追加することができる.また,図11(2)(3)で選択した単語を「削除」ボタンを押すことによりリストから削除す ることができる.
多義性解消パネル: 概念リスト

図12: 多義性解消パネル: 概念リスト
図12は図10(2) 「概念リスト」を拡大した図である.概念リストは,図11(2)または(3)で選択した完全照合または部分照合単語を表記とし て持つ参照オントロジー中の概念のリストを表示する.図12は,「book」を表記として持つ参照オントロジー(この例ではWordNetのみを参照オン トロジーとしている)中の概念のリストを示している.リストの項目は,3つの部分から構成されている.左側は後で述べる自動多義性解消を行った際のランキ ングの値を示す.ランキング値が高い概念ほど上位に表示される.中央は,概念のIDをあらわす.「wn:」はWordNetの名前空間の接頭辞を示してお り,ここで表示される接頭辞は,図8(2)で示した名前空間テーブルで設定した接頭辞となる.右側の単語は,概念の表記が複数ある場合,そのうちのいずれ か一つが表示される.
多義性解消パネル: 概念情報

図13: 多義性解消パネル: 概念情報
図13は図10(3) 「概念情報」を拡大した図である.「概念情報」には,図12の「概念リスト」で選択された概念の見出しと説明を表示する.「言 語リスト」で選択した言語の見出しまたは説明が「見出しリスト」または「説明リスト」に表示される.図13下部の「構築オプション」は,概念階層の構築方 法を設定するためのオプションである.「構築オプション」には,図11「単語リスト」で選択する単語の種類に応じて3種類の表示方法がある.図11(2) で完全照合単語を選択した場合,図13左側のように「構築オプション」には何も表示されない.図11(2)でシステムが自動的に追加した単語(added が表示されている単語)を選択した場合には,図13中央のように「構築オプション」には「下位概念に置換」するかどうかを選択するチェックボックスが表示 される.図11(3)で部分照合単語を選択した場合には図13右側のように「構築オプション」には,「同一概念」か「下位概念」かの選択をするためのラジ オボタンが表示される. 図13中央の「構築オプション」の例として,「letter book」のみを入力単語とした場合を考える.「letter book」という単語は参照オントロジー中の概念の表記に含まれないため,部分照合単語となる.「letter book」は形態素解析をすることにより,「letter」と「book」に分割できる.形態素リストの末尾から順番に照合していった場合, 「letter book」は「book」が参照オントロジー中の概念と照合する.この例では,「letter book」のみを入力単語としているため,「book」は入力単語としていない.そのため,「book」はDODDLE-OWLにより自動的に完全照合単 語リストに「システムが追加した単語」として追加される.「book」の多義性解消を行う際に,図13中央の「構築オプション」として「下位概念に置換」 というチェックボックスが表示される.ここでは,「book」はシステムが自動的に追加した単語であるため,ユーザがあえて「book」を入力単語としな かったのか,入力単語にし忘れたかの確認をしている.ユーザがあえて「book」を入力単語にしなかった場合,概念階層中に「book」は表示されるべき ではない.「構築オプション」の「下位概念に置換」をチェックすることにより,「letter book」は「book」の下位概念とはならず,概念階層中に表示されない.ユーザが「book」を入力単語に追加し忘れた場合には,「構築オプション」 の「下位概念に置換」にチェックをいれなければ,「letter book」は「book」の下位概念として概念階層が構築される. 図13右側の「構築オプション」の例として,「book」と「letter book」を入力単語とした場合を考える.上記と同様に「letter book」は「book」で照合する部分照合単語である.「letter book」の多義性解消を行う際に,図13右側の「構築オプション」が表示される.「同一概念」の方を選択した場合は,概念階層構築時に「letter book」は「book」と同一概念として扱われる.つまり,「letter book」はbookに対応する参照オントロジー中の概念の別表記として概念階層が構築される.一方,「下位概念」の方を選択した場合は,「letter book」は「book」とは異なる概念,ここでは,「book」の下位概念として概念階層が構築される.デフォルトで,部分照合単語を「同一概念」とみ なすか,「下位概念」とみなすかは,オプションダイアログにより設定することができる.
多義性解消パネル: 階層構築オプション

図14: 多義性解消パネル: 階層構築オプション
図14は図10(7) 「階層構築オプション」を拡大した図である.図14の「構築オプション」は,「新規」か「追加」かをラジオボタンで選択でき る.「新規」を選択した場合は,図10(1)「単語リスト」にある単語から概念階層を新たに構築する.「追加」を選択した場合は,「クラス階層構築パネ ル」及び「プロパティ階層構築パネル」に既に構築されている概念階層に,図10(1)「単語リスト」にある単語から構築した概念階層を合成する.現状で は,「追加」は未実装のため選択しても既存概念階層に新たに構築した概念階層を合成することはできない. 図14の「完全照合オプション」は,完全照合単語リストから概念階層を構築する際のオプションである.「構築」チェックボックスでは,完全照合単語 リストから概念階層を構築するかどうかを選択する.「剪定」チェックボックスでは,概念階層構築時に剪定を行うかどうかを選択する.DODDLE-OWL においてどのような剪定を行うかは,階層構築パネル説明時に述べる.「参照オントロジーの概念見出しを追加」チェックボックスでは,概念階層構築時に,各 概念の見出しとして,入力単語として与えた単語のみを概念の見出しとするか,対応する参照オントロジー中の概念の見出しをすべて利用するかどうかを選択す る. 図14の「部分照合オプション」は,部分照合単語リストから概念階層を構築する際のオプションである.「構築」チェックボックスでは,部分照合単語 リストから概念階層を構築するかどうかを選択する.「剪定」チェックボックスでは,概念階層構築時に剪定を行うかどうかを選択する.部分照合単語リストか ら概念階層を構築する際にどのような剪定を行うかは,階層構築パネル説明時に述べる.「抽象概念を追加」チェックボックスでは,部分照合単語リストから概 念階層を構築する際に,類似概念をグループ化して共通の上位概念を挿入するかどうかを選択する.このチェックボックス右側のテキストフィールドには,いく つ以上グループ化できる場合に共通の上位概念を挿入するかを自然数で入力する.詳細については,概念階層構築パネル説明時に述べる. 図14右端にある「クラス階層構築」ボタンを押すと,上記の階層構築オプションより,クラス階層構築パネルにクラス階層(Is-a)のみが構築され る.「クラス及びプロパティ階層構築」ボタンを押すと,上記の階層構築オプションより,クラス階層構築パネル及びプロパティ階層構築パネルに,クラス階層 (Is-a)及びプロパティ階層(Is-a)が構築される.クラス階層とプロパティ階層の両方を構築するためには,参照オントロジーとしてEDR一般辞書 を利用しなければならない.
自動多義性解消
入力単語数が多い場合や入力単語が多くの意味を持つ場合,多義性解消はユーザの負担となる.DODDLE-OWLでは,主に2種類の自動多義性解消 方法を提供している.両手法共に入力単語に対応する概念候補の関係値を求めてランキン グを行い,関係値の高い概念から順番に表示することにより,ユーザが多義性解消を行うことを支援する. メニュー「ツール」→「自動多義性解消」より自動多義性解消を実行することができる.自動多義性解消を行うと,図10(2)の概念リストがランキン グに従ってソートされて表示される.ランキングにどのような指標を用いるかは,オプションダイアログの多義性解消タブから設定できる.以下では,2種類の 自動多義性解消方法について述べる. 1つ目の関係値の計算方法は以下のとおりである.
- 対象とする概念からそのルート概念までの各パスに出現する概念のうち,入力語彙を表記として持つ概念の総数の最大値
- 対象とする概念の全ての下位概念のうち,入力語彙を表記として持つ概念の総数
- 対象とする概念の兄弟概念のうち,入力語彙を表記として持つ概念の総数
以上,3つの中からユーザは1つ以上の指標を選択し,選択した指標により得られた関係値の総和を用いて,入力単語に対応する概念候補をランキングする. 2つ目の方法における関係値の計算方法は以下のとおりである.
- 入力単語に対応する概念候補となる概念集合を得る
- 概念集合から2つの組み合わせを求め,それぞれの概念間距離を求める
- ある概念の関係値は,ある概念と組み合わせ関係にある概念集合との概念間距離の逆数の総和とする
多重継承している場合には,概念間距離が複数考えられる.その場合には,最短,最長,平均のどれかをユーザは選択することができる.
概念階層構築
概念階層構築方法

図15: 概念階層構築工程
概念階層構築では参照オントロジーを参照し,概念の照合および部分木の剪定を行うことにより,領域オントロジーの基礎となる概念階層の初期モデルを構築する.図15に概念階層構築工程を示す.「多義性解消パネル」によ り入力語彙と対応づけられた概念(入力概念)のみを末端ノードとする部分木(入力概念からルートまでのパス)を参照オントロジーから抽出し,ベストマッチモデルする.ベストマッチモデルには,各入力概念間の位相関係(祖先・親子・兄弟関係)を保持することに貢献する中間概念とそうでない中間概念が存在する.階層関係を保つために必要な中間概念をSIN(a Salient Internal Nodes)と呼ぶ.図15ベストマッチモデルにおいて,黄色のノードがSINである.ベストマッチモデルにおいて無地(白色)のノードは,階層関係を保 つことに貢献しないため,不要な中間概念として削除する.中間概念を削除する過程はTrimming(刈り込み)に似ているため,この工程を剪定と呼ぶ. 剪定によって得られた入力概念とSINのみから構成される概念階層を初期モデルと呼ぶ. 多義性解消時に部分照合された複合語について,語尾および語頭による階層化を行っている.語尾が等しい複合語(部分照合した概念が等しい入力単語)は,兄 弟概念として階層化される.例えば,「排出設備設置」及び「供給設備設 置」がEDR電子化辞書中の「設置」概念に部分照合した場合,両者は「設置」概念の下位概念として定義される. 部分照合した入力単語の語尾以前(照合しなかった部分)の文字列を表記として持つ概念が構築中の領域オントロジー内に存在する場合,その上位概念と入力単 語の語尾を組み合わせた概念を入力単語の上位概念として定義する.例えば, 「計器」の下位概念に「レーダ」,「センサー」,「ゲージ」という概念が定義されているとする.「モデル情報」,「レーダ情報」,「センサー情報」, 「ゲージ情報」という複合語を階層化する場合,語尾による階層化では,「情報」の下位概念に,「モデル情報」,「レーダ情報」,「センサー情報」,「ゲー ジ情報」が定義される.ここで,複合語の語尾以前の単語である,「レーダ」「センサー」「ゲージ」については,領域オントロジー中に共通の上位概念である 「計器」が定義されている.よって,「計器」と複合語の語尾の「情報」を組み合わせて,「計器情報」という表記を持つ概念を作成し,その下位概念に「レー ダ情報」,「センサー情報」,「ゲージ情報」を定義しなおす.これにより,「モデル情報」と「レーダ情報」,「センサー情報」,「ゲージ情報」という計器 に関する情報に分類することができる.領域に特化した意味で階層化された概念階層を参照しているため,妥当な複合語の階層化が可能だと考えられる.ここで 「計器情報」のような概念を抽象概念と呼ぶ.図16に,語尾および語頭による複合語の階層構築を示す.

図16: 部分照合単語の階層構築例
初期モデルは,以下で述べる概念階層洗練手法を用いて,ユーザとのインタラクションにより洗練され,最終的な領域オントロジーにおける概念階層となる.
EDR概念記述辞書を用いたプロパティ階層構築および概念定義
DODDLE-OWLは,EDR概念記述辞書を用いてプロパティ階層の構築および概念定義を行うことができる.EDR概念記述辞書には動詞的概念が名詞的概念を支配する場合の格関係を中心に,agent,object, goal, implement,a-object,place,scene,causeの 8 種類の概念関係が定義されている.DODDLE-OWLはEDR概念記述辞書に定義されている動詞的概念およびその下位概念をOWLにおけるオブジェクト プロ パティとみなし,階層構築時に名詞的概念階層(クラス階層)とは分離してプロパティ階層構築を行う. また,DODDLE-OWLは,8種類の概念関係のうちagent関係がある名詞的概念をプロパティの定義域,object関 係がある名詞的概念をプロパティの値域として定義する. プロパティ階層構築にも,クラス階層構築における完全および部分照合単語階層化と同様のアルゴリズムが適用可能である.完全照合単語を階層化する際には, 不要概念の剪定が行われる.そのため,以下の場合に概念定義の整合性が保持できなかったり,概念定義が欠落してしまう問題が発生する.
- クラス階層中の剪定された概念がagentまたはobjectの値として定義されている場合
- プロパティ階層中の剪定された概念にagentまたはobject関係が定義されている場合
DODDLE-OWLでは,1.については,剪定された概念の下位概念に置換することで整合性を保持している.2.については,剪定されたプロパティの下位概念に定義域および値域を継承させることにより概念定義が欠落しないようにしている.
概念階層洗練

図17: 概念階層洗練工程
参照オントロジー(特 に汎用オントロジー)から半自動構築された初期概念階層は一般的な階層関係が定義されているため,ユーザは概念変動と呼ばれる 問題を考慮しながら,初期概念階層を特定の領域に調整する必要がある.概念変動管理のために,DODDLE-OWLは照合結果分析,剪定結果分析,多重継 承の除去の3つの戦略を適用する(図17参照).戦略1は入力概念集合と汎用オントロジーとの照合結果の観点から, 戦略2は剪定結果の観点から,戦略3は多重継承から概念変動を同定する戦略である.
戦略1: 照合結果分析
戦略1では,初期領域オントロジーにおいて,入力概念の位置関係から再利用可能な領域と不可能な(概念変動が発生していると推定される)領域に分割 し,再利用不可能な領域を移動することによって概念変動を解消する. 入力概念は,問題領域から考えてほぼ妥当と考えられた概念のため,それらが連続するパスは,妥当な概念が集中していると考え,再利用可能なパスとみなせ る.このパスをPAB(PAths including only Bestmatches)}と呼ぶ.一方,SINが含まれる領域は,概念構造の差異(概念変動)が生じている可能性があるため,移動すべき領域とみなせる.この領域をSTM(SubTrees manually Moved)と呼ぶ.PABとSTMの定義を以下に示す.
- PABの定義
- ルートからベストマッチノードが複数個連続しているパス.
- STMの定義
- SINをサブルートとし,その下位ノードがすべてベストマッチノードで構成される部分木.

図18: 照合結果分析
図18にPABと STMの例を示す.実線で囲まれた部分木がPAB,破線で囲まれた部分木がSTMである.ユーザーはSTMを移動する事で初期モデ ルを洗練し,領域概念階層を構築する.STMの移動先についてはユーザが決定し,移動する必要がないと判断した場合は移動しない.移動時にユーザーが不必 要と判断したSTMのルートノードは消去してもよい.戦略1は,照合結果を分析することによって得られた戦略のため,照合結果分析(Matched Result Analysis:MRA)}と呼ぶ. y
戦略2: 剪定結果分析
戦略2では,初期モデルにおいて,同じ親ノード(上位概念)を持つ兄弟ノード間で,剪定された中間概念数の差が大きい場合,その階層関係を再構成す るよう示唆する. 剪定工程で,削除された中間概念とそれにつながる入力概念以外の概念を含む領域が全て削除されることは,汎用オントロジーによる概念の分化の方法が問題領 域の概念の分化の方法と異なっていることを示しているといえる.そのような部分木に対して分化の再構成をユーザに促す.剪定の際の削除数の差が初期モデル のルートから末端概念までの距離の1/3以上であった親子ノードに対し,再構成をユーザに示唆する.「1/3」という数字は,ユーザによって任意に設定す ることもできる.戦略2は関連情報の削除結果の分析によって行なわれる戦略のため,剪定結果分析(Trimmed Result Analysis:TRA)と呼ぶ.剪定結果分析の適用例を図19に示す.図19のベストマッチモデルを剪定した結果,概念Aと概念D間の領域が全て削除 された.このような変化は概念Aの分類属性が,対象となる問題領域では異なった形で分化に利用されている可能性があることを意味し,ここに概念変動が発生 していると考えられる.この例では,対象となる問題領域では,概念Dは概念Aの下位概念ではなく,概念Cの下位概念として概念階層を再構成している.

図18: 剪定結果分析
戦略3: 多重継承の除去
汎用オントロジーは網羅的に階層関係を定義するため に,多重継承を多用している.WordNetやEDR電子化辞書では多くの概念が多重継承しているが,大部分はある領域においては不要な継承関係となる. DODDLE-OWLでは,多重継承している概念の一覧を提示し,どの概念を上位概念として持つかをユーザに提示することにより,多重継承の除去を容易に 行うことができる.図19に多重継承の除去の様子を示す.

図19: 多重継承の除去
以上の戦略による修正個所の同定を受けて,DODDLE-OWLはユーザに修正個所を示唆し,領域概念階層構築を支援する.
クラス階層構築パネル

図20: クラス階層構築パネル
図20にクラス階層構築パネルを示す.以下に各部分の説明を示す.
- 図20(1) 未定義単語リスト
- 参照オントロジー中の概念に照合しなかった入力単語リスト.単語を選択し,「Is-a階層パネル」にドラッグすると,未照合単語を概念としてIs-a階層に追加できる.
- 図20(2) 概念情報パネル
- 概念階層中の選択された概念のURI,代表見出し(階層中に表示する見出し),見出し,説明,概念変動管理情報を表示する.見出しと説明については,言語属性の付与と追加,編集,削除が可能.
- 図20(3) 概念階層パネル
- クラスIs-a階層とHas-a階層.概念の検索,追加,削除などを行うことができる.
- 図20(4) 概念変動管理パネル
- 照合結果分析結果,剪定結果分析結果,多重継承している概念をリストで表示し,各項目を選択するとIs-a概念階層中の修正候補箇所が示される.
以下では,図20(2)から(4)の詳細を説明する.
概念情報パネル

図21: 概念情報パネル
図21は図20(2)概念情報パネルを拡大した図である.図21(1)では,接頭辞をプルダウンメニューから選択し,ローカル名をテキスト フィール ドに入力し,「URIの設定」ボタンを押すことで,選択した概念のURIを変更することができる.図8(2)で示した名前空間テーブルに定義された接頭辞 が選択可能である. 図21(2)は概念の見出しを編集するための領域である.「言語」リストの項目を選択することで,選択した言語の見出しが「見出し」リストに表示さ れる.図21(2)では,日本語見出しとして予定表が表示されている.図21(2)下部の「言語」と「テキスト」テキストフィールドに追加したい見出しの 言語とテキストを入力し,「追加」ボタンを押すことで概念の見出しを追加することができる.また,選択した見出しを編集したい場合には「編集」ボタンを, 削除したい場合には「削除」ボタンを押すことにより,見出しの編集及び削除を行うことができる.また,「表示見出しの設定」ボタンを押すことで,選択され た見出しがIs-a階層およびHas-a階層パネルの概念の表示見出しとなる. 図21(3)は概念の説明を編集するための領域である.見出しと同様に「言語」リストの項目を選択することで,選択した言語の説明が「説明」リスト に表示される.また,「追加」または「編集」ボタンを押すと図21(5)の「概念説明の編集」ダイアログが表示される.ここで,「言語」と「説明」を入力 し,「OK」ボタンを押すと,概念の説明の追加や編集を行うことができる.また,「削除」ボタンにより選択された概念の説明を削除することができる. 図21(4)は,概念変動管理情報を表示・編集するための領域である.「ノードのタイプ」は,編集対象のノードがSIN(参照オントロジーから抽出 した概念)かベストマッチノード(入力概念)かを表示する.SINの中でベストマッチノードとしたいノードについては,ここでノードのタイプをSINから ベストマッチに変更することができる.「剪定概念数」は,階層構築時の剪定により,選択された概念とその上位概念の間の概念がいくつ削除されたかを表示し ている.「多重継承」は,編集対象のノードが多重継承をしているかしていないかを表している.多重継承をしている場合は「true」,していない場合は 「false」となる.
Is-a階層及びHas-a階層パネル

図22: Is-a階層パネルとHas-a階層パネル

図23: Is-a階層パネルとHas-a階層パネルのツールバーとメニュー
図22は図20(3) を拡大した図である.図22の左側がIs-a階層を右側がHas-a階層を示している.図22(1)は概念階層中の概念を検索するた めの領域である.図22(1)上部のテキストフィールドに検索キーワードを入力し,「検索」ボタンを押すと検索オプションを満たす概念をハイライトする. 候補が複数ある場合には,「次」「前」ボタンで概念候補に移動できる.検索オプションとしては,概念の見出し,説明,言語が選択できる.また,「完全一致 検索」チェックボックスにチェックをいれると,入力した文字列と完全に一致する見出しや説明を含む概念のみが検索される.このチェックボックスにチェック が入っていない場合は部分一致検索となり,検索キーワードを見出しまたは説明の一部に含む概念が検索される.「URI検索」チェックボックスにチェックを いれると,概念のURIも検索対象となる.「大文字と小文字の区別」チェックボックスにチェックをいれると,英語見出しまたは説明を検索する際に,大文字 と小文字を区別して検索する. 図22(3)はIs-a階層とHas-a階層を表示・編集するためのパネルを示している.図22(2)のツールバーまたは概念を選択して,マウスを 右クリックすることで表示されるポップアップメニューから,概念の追加,削除等を行うことができる.図23はIs-a階層パネルとHas-a階層パネルの ツールバーとポップアップメニューをそれぞれ示している.ツールバーの各アイコンが意味する操作は,ポップアップメニューのアイコンの右に示されている説 明と同様である.Is-a階層とHas-a階層の主な違いとして,Has-a階層はIs-a階層で定義された概念を用いて定義する点が異なる.Has-a 階層では,概念そのものを削除することはできない.注意点として,「概念の削除」は削除対象となっているノードと同一URIを持つノードをすべて削除する のに対して,「上位概念へのリンクを削除」は,多重継承している場合に削除対象のノードとその上位概念の間の関係を削除する.また,「元に戻す」と「やり 直す」は,クラス,プロパティのIs-a,Has-a階層パネルのすべてに対して50回分の操作履歴を保存しており,各パネル個別に操作履歴を現状では保 存していない. Is-a階層パネルとHas-a階層パネルのクラスには以下の4種類があり,それぞれアイコンが異なっている.

- 単一継承のSIN(a Salient Internal Nodes)ノード.

- 単一継承のベストマッチノード(入力概念).

- 多重継承のSIN(a Salient Internal Nodes)ノード.

- 多重継承のベストマッチノード(入力概念).
概念変動管理パネル

図24: 概念変動管理パネル
図24は図20(4)概念変動管理パネルの各タブを展開し,拡大した図である.図24(1)は照合結果分析の結果をリストで表示している.リストの項目はSINノー ドであり,項目を選択するとIs-a階層中の該当する部分木がハイライトされる.また,照合結果分析結果を確認し修正する必要がなかった場合,もしくは, 修正後に「照合結果分析結果の確認」ボタンを押すことで,選択した項目をリストから削除することができる. 図24(2)は剪定結果分析の結果をリストで表示している.図24(2)下部の「剪定概念リスト」は,概念階層構築時に剪定された,選択した概念と その上位概念の間の概念が提示されている.「剪定結果分析」ボタンを押すと,ボタン左側にあるテキストフィールドに指定した数よりも多くの中間概念が削除 された概念を上部のリストに表示する.また,剪定結果分析結果を確認し,修正する必要がなかった場合,もしくは,修正後に「剪定結果分析結果の確認」ボタ ンを押すことで,選択した項目をリストから削除することができる.(当該概念の剪定概念数がゼロとなる) 図24(3)の上部は多重継承している概念のリストを表示している.リストの項目を選択すると,下部に多重継承しているノードのリストが表示され る.このノードを選択すると,Is-a階層パネル中の概念に移動し,ノードをハイライトする.「上位概念へのリンクを削除」ボタンを押すと,選択した概念 と上位概念の間の関係が削除される.
プロパティ階層構築パネル

図25: プロパティ階層構築パネル
図25にプロパティ階 層構築パネルを示す.プロパティ階層構築パネルの構成要素の大部分は,クラス階層構築パネルと同様である.異なる点は,図25 (1)の概念定義パネルがある点である.図25(1)の概念定義パネルは,汎用オントロジーとしてEDR一般辞書を指定し,プロパティ階層を構築した場 合,EDR概念記述辞書における,agentおよびobjectの関係にある概念を定義域および値域として自動的に定義している.また,クラス階層を参照し,定義域および値域の追加を行うことも可能である. Is-a階層パネルとHas-a階層パネルのプロパティには以下の4種類があり,それぞれアイコンが異なっている.

- 単一継承のSIN(a Salient Internal Nodes)ノード.

- 単一継承のベストマッチノード(入力概念).

- 多重継承のSIN(a Salient Internal Nodes)ノード.

- 多重継承のベストマッチノード(入力概念).
概念定義
WordSpaceを用いた概念対の抽出
共起統計の計算手法としてDODDLE-OWLはWordSpace [7]を利用している.WordSpaceから得られる共起情報を基に,文脈類似概念対を専門文書から抽出し,概念定義に関わる可能性のある概念対として利用する.文脈の類似は,その語句間の何らかの概念関係の存在を示唆していると仮定する.WordSpaceは以下のように定義される.
- WordSpace
- 語彙の共起統計から大規模な単語群の意味表現を誘導するコーパスに基づく方法である.WordSpaceによって,出現語句を共起情報を含むベク トルとして表現できる.この単語ベクトルの集合である多次元ベクトル空間がWordSpaceであり,2ベクトル間の内積は出現語句の文脈類似度の指標と なる.
以下に共起統計に基づく文脈類似概念対の抽出手順を述べる.
高頻度単語N-gramの抽出
文字単位の共起情報は膨大であるため,N個の単語からなる頻出句単語N-gramを抽出し共起の最小単位として用いる.文字単位 のN-gram統計を取るのに比べ意味の無い文字列の共起情報を除外でき,よりテキストの文脈表現に役立つ情報が抽出できる.オリジナルの WordSpaceでは,文字単位の共起を用いてWordSpaceの構築を行っているが,本システムでは単語単位N-gramの共起を最小単位として扱 う.従って,通常のWordSpace構築時に文字単位共起をある程度まとまった形で表現するために行う4-gramベクトル構築工程は行わない.ここで 抽出された単語N-gram集合で,専門文書における出現が高頻度のものを用いる.これにより専門文書は単語N-gramの配列とみなせる.
WordSpaceの構築
抽出された高頻度単語N-gramを最小単位として以下の流れでWordSpaceを構築する.図26はその概要である.

図26: WordSpaceの構築
文脈ベクトルの構築
- 1. 文脈ベクトルの構築
- ある単語の文脈を二つで比較するために,文脈ベクトル(context vector)を構築する.文脈ベクトル
の要素
は,単語wiの出現場所周辺(文脈スコープ)の単語N-gram
の出現数である.つまり,ある単語周辺にどの単語N-gramがいくつ出現したかをカウントしたものが文脈ベクトルである. - 2. 単語ベクトルの構築
- 次に文脈ベクトルから単語のベクトル表現である単語ベクトル(word vector)を導く.ある単語のベクトル表現
は,単語wiのテキスト内での出現場所すべての文脈ベクトル
の和を取ったものである.こうして計算された単語ベクトル集合がWordSpaceであるが,本システムでは単語ではなく概念のベクトル表現が必要となるため,更に次のステップを行う. - 3. 概念ベクトルの構築
- 既に入力語彙それぞれのWordNetにおけるベストマッチsynsetが特定されており,これらsynsetに含まれる単語のベクトル表現の和を入力語彙に対応する概念のベクトル表現,概念ベクトル(concept vector)とする. 概念ベクトル
は以下の式で表せる.ここで,
は単語wのテキストにおける全出現場所,
は単語wのテキスト位置iにおける文脈ベクトルである.

文脈類似概念対の抽出
ここまでの処理で定義概念全てのベクトル表現が得られる.この概念ベクトル間の内積は,概念間の文脈類似度となる.文脈類似度に対してある一定の閾 値を設定し,それを越える値を持つ概念対を文脈類似概念対として抽出し,これを概念仕様テンプレートの概念と値の組とする.概念ベクトル
間の文脈類似度
には以下の計算式を用いる.

相関ルールによる概念対の抽出
専門文書から概念定義の候補となる概念対を獲得するもう1つの方法として,相関ルールを利用する.相関ルールは代表的なデータマイニング技術の1つ であ り,概念定義にも利用されている.専門文書から相関ルールを抽出し,概念定義の候補となる概念対として利用する.抽出された相関ルールに含まれる概念間 に,何らかの概念関係が存在すると仮定する.
相関ルールの抽出
専門文書から,1文を1つのトランザクション,1文中に出現する入力語彙をそのアイテム集合としてトランザクションデータベースを作成する.最小支 持度と最小信頼度を満足する相関ルールを見出す.通常,相関ルールX => YのX(条件部)には複数のアイテムを許すが,ここでは概念対を抽出したいため,X,Yともに1つずつのアイテム,つまり1つずつの概念のみを獲得する. 得られた概念対を概念仕様テンプレートの概念と値の組とする.
相関ルールの定義
アイテム集合をI={i1, i2,…,im},トランザクションデータベースをD={t1, t2,…,tn} (ti
I)とする.各要素tiをアイテム集合(itemset)と呼ぶ.長さkのアイテム集合とはk個のアイテムの組合せを指す.アイテム集合Xの支持度 support(X)はD全体に対しXを含むトランザクションの割合を表す. 相関ルールはX => Y表現される.X,Y
I,X
Y=
と する.相関ルールには支持度(support),信頼度(confidence)の2つのパラメータがあり,これらの値は相関ルールの有意性を示す.相関 ルールX => Yの支持度 support(X => Y)はD全体に対しXとYを共に含むトランザクションの割合support(X
Y)により定義される.信頼度confidence(X => Y)はDの中でXを含むトランザクションの割合,support(X
Y)/support(X)により定義される. 相関ルールの抽出は,ユーザによって指定された最小支持度(minimum support)と最小信頼度(minimum confidence)を満足する全てのルールを見出すことに相当する.
抽出アルゴリズム: Apriori
相関ルールは次の2つのステップで抽出される.
- 最小支持度を満足するアイテム集合を全て獲得する.これらのアイテム集合をラージアイテム集合と呼ぶ.
- 第1ステップで求めたラージアイテム集合から,最小信頼度を満たす相関ルールを抽出する.
相関ルール抽出処理のうち,第2ステップは第1ステップで求めたラージアイテム集合に対してルールを導出する処理でありその負荷は軽いのに対し,第 1ス テップはトランザクションデータベースを繰り返し検索し,数多くのアイテム集合の支持度を調べるため,処理時間の大半を占め,この効率化が試されている. Apriori [8]は1994年IBMアルマデン研究所のR.Agrawalらによって提案された,現在最も広く利用されている基本的な逐次アルゴリズムである. 以下にAprioriのアルゴリズムを示す.k個のアイテムの組合せをk-itemset,長さk のラージアイテム集合をLk,長さkの候補アイテム集合をCkとする.長さk(
2)の場合の処理は次のようになる.
- 長さ(k-1)のラージアイテム集合Lk-1から,長さkの候補アイテム集合Ckを作成する.
- トランザクションデータベースを検索し,支持度を求める.
- 最小支持度を満足するものを取り出し,長さkのラージアイテム集合Lkとする.
この処理は新たなラージアイテム集合が空となるまで続けられる. 図27に最小支持度50%の場合の例を示す.トランザクションデータベースを検索し,それぞれのアイテムがトランザクションに含まれる回数(支持回数)を数え上げ(C1),そのうち最小支持度を満たすものを取り出し,ラージアイテム集合L1を求める.次にL1から2つのアイテムの組合せの候補アイテム集合C2を作成し,データベースを検索して支持回数を数え上げ,長さ2のラージアイテム集合(L2)を求める.以下同様にしてラージアイテム集合を求めていく.

図27: Aprioriによるラージアイテム集合抽出の例
概念定義パネル

図28: 概念定義パネル
図28に概念定義パネルを示す.概念定義パネルでは,概念定義を支援するために,WordSpaceと相関ルール(Apriori)の2つの共起性に基づく手法を用いて,専門文書から概念定義の候補となる概念対を抽出する.以下に概念定義パネルの各部分の説明を示す.
- (1) パラメータ設定
- WordSpaceおよびAprioriのパラメータ設定を行う.
- (2) 入力概念リスト
- 入力単語パネルで設定した入力単語を表示.
- (3) 入力文書リスト
- WordSpaceおよびAprioriを実行する時に,入力文書が複数ある場合に,どの入力文書に対して実行するかを選択する.
- (4) 関連概念リスト
- 入力概念リストから選択した概念と関連のある概念を関係値と共に提示.関係値が高いほど関連がある.
- (5) 概念対定義
- (2)で選択した入力単語と関連のある(4)で選択された単語を表示し,正解概念対または不正解概念対として(6)に追加する.矢印の向きによって,定義域と値域が変化する.
- (6) 正解概念対と不正解概念対のリスト
- 正解概念対は,領域オントロジーの概念定義となる.不正解概念対は関係のない概念対として設定し,関連概念リストから除去する.正解概念対については,関係(プロパティ)をプロパティ階層から選択することができる.
視覚化モジュール
DODDLE-OWLでは視覚化モジュールを用いることで,領域オントロジーの洗練を視覚的に行うことができる.視覚化モジュールにはMR3 (Meta-Model Management based on RDFs Revision Reflection)を利用している.MR3は,RDFとRDFSをモデルとメタモデルの関係としてとらえ,両者の視覚的編集および両者の間の関係を(半)自動的に管理するツールである.MR3のプラグイン機構を用いることで,MR3とDODDLE-OWLの間でOWLデータの交換を行うことができる. 領域オントロジー構築におけるMR3の役割は主に2つある.1つ目はオントロジー洗練モジュールにおける概念変動管理を視覚的に支援する機能である.MR3の クラスおよびプロパティエディタにオントロジー構築モジュールで構築された初期概念階層を表示し,ユーザはDODDLE-OWLが示唆する概念変動を行う 箇所の編集を行うことができる.2つ目はオントロジーの外在化である.オントロジーの外在化とは概念階層と概念定義をDODDLE-OWL以外の見方に よって視覚的に表示することを意味する.オントロジーの外在化を行うことによって,オントロジー全体(クラス階層,プロパティ階層,概念定義)のバランス を見ながら調整を行い,領域オントロジーの質を向上させることができる.また,MR3はDODDLE-OWLとは異なり,階層をグラフにより表示することができるため,多重継承の可視性を向上させることができる. 最終的にDODDLE-OWLで構築した領域オントロジーをMR3にインポートすることで,インスタンスの構築をすることも可能となる.
領域オントロジーの保存
「ファイル」→「保存」→「オントロジーを保存」メニューを選択すると構築した領域オントロジーをOWL形式でファイルに保存することができる.以下では,接頭辞rdf,rdfs,owl,skos,doddleは以下の名前空間をあらわしている.
- rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#
- rdfs: http://www.w3.org/2000/01/rdf-schema#
- owl: http://www.w3.org/2002/07/owl#
- skos: http://www.w3.org/2004/02/skos/core#
- doddle: http://www.yamaguti.comp.ae.keio.ac.jp/doddle#
DODDLE-OWLによって構築される領域オントロジーは,階層関係と非階層関係から構成される.クラスのIs-a階層は,OWLが提供するowl:Class要素とrdfs:subClassOfプロパティにより定義する.クラスのHas-a階層は,owl:Class要素とdoddle:partOfプロパティにより定義する.プロパティのIs-a階層は,owl:ObjectProperty要素とrdfs:subPropertyOfプロパティによって定義する.プロパティのHas-a階層は,owl:ObjectProperty要素とdoddle:partOfプロパティによって定義する.非階層関係は,概念対の間の関係をOWLにおけるプロパティ,概念対をプロパティの定義域および値域としてとらえ,OWLが提供するowl:ObjectProperty要素,rdfs:domainおよびrdfs:rangeプロパティによって定義する.図19の上部は,actという概念の下位概念としてaimとbehaviorが定義された階層関係を,OWL形式に変換する方法を示している.図29の下部は,timeとofferという概念の間にattributeという関係がある非階層関係を,OWL形式に変換する方法を示している. また,DODDLE-OWLでは概念の見出しをrdfs:labelプロパティ,概念の説明をrdfs:commentプロパティ,概念の代表(表示)見出しをskos:prefLabelプロパティを用いて定義している.

図29: OWL形式 変換例
プロジェクトの保存と復元
DODDLE-OWLでは,領域オントロジーの構築を途中で一時中断したい場合に,プロジェクトファイルを保存することで,構築状態を保存すること ができる. 図30に示すように,「ファイル」→「プロジェクトを名前を付けて保存」メニューを選択すると,ファイル保存ダイアログが表示される(図31).ここで, ファイル名を入力し,「保存」ボタンを押すと,プロジェクトファイルを保存することができる. 領域オントロジー構築作業を再開したい場合には,「ファイル」→「プロジェクトを開く」メニューを選択すると,保存と同様,ファイルを選択するダイアログ が表示されるため,プロジェクトファイルを選択し,「開く」ボタンを押すと,プロジェクトファイルを復元することができる. すでにプロジェクトファイルを開いている状態で,構築状態をプロジェクトファイルに上書き保存したい場合には,「ファイル」→「プロジェクトを上書き保 存」メニューを選択すればよい.

図30: プロジェクトの保存

図31: ファイル保存ダイアログ
プロジェクトファイルの構成
DODDLE-OWLではプロジェクト保存時にファイルを保存先に指定した場合には,プロジェクト構成ファイルを一つのファイルに圧縮して保存す る.プロジェクト保存時にフォルダを指定した場合には,指定したフォルダにプロジェクトを構成するファイルをテキスト形式で保存する.以下に各プロジェク トファイルの内容を示す.
- AprioriResultsフォルダ
- 概念定義パネルでAprioriを実行した結果を各入力文書ごとに保存.
- OWLMetaDataSetフォルダ
- オントロジー選択パネルのOWLオントロジー選択タブにおける各テンプレートのパスを保存.
- WordSpaceResultsフォルダ
- 概念定義パネルでWordSpaceを実行した結果を各入力文書ごとに保存.
- ClassTrimmedResultAnalysis.txt
- クラス階層構築パネルにおける剪定結果分析の結果を保存.
- ConceptDefinition.txt
- 概念定義パネルにおける概念定義(正解概念対とその間のプロパティ)を保存.
- ConceptDefinitionParameters.txt
- 概念定義パネルにおけるAprioriとWordSpaceのパラメータを保存.
- ConstructTreeOption.txt
- 多義性解消パネルにおける階層構築オプションの状態を保存.
- docInfo.txt
- 入力文書選択パネルにおいて選択した入力文書のパスを保存.
- GeneralOntologyInfo.txt
- 汎用オントロジーの選択状態を保存.
- InputConceptSet.txt
- 入力概念のURIのリストを保存.
- InputWord_ConstructTreeOption.txt
- 多義性解消パネルにおける各部分照合単語の構築オプションを保存.
- InputWordConceptMap.txt
- 入力単語と参照オントロジー中の概念のURIとの対応関係を保存.「ファイル」→「開く」→「入力単語と概念の対応を開く」メニューから復元できる.
- InputWordSet.txt
- 多義性解消パネルに設定された入力単語リストを保存.「ファイル」→「開く」→「入力単語リストを開く」メニューから復元できる.
- log.txt
- 操作履歴を保存.
- Ontology.owl
- 領域オントロジーをOWL形式で保存したファイル.「ファイル」→「開く」→「OWLオントロジーを開く」メニューから復元できる.
- projectInfo.txt
- プロジェクト情報(クラス数,プロパティ数など)を保存.
- PropertyTrimmedResultAnalysis.txt
- プロパティ階層構築パネルにおける剪定結果分析の結果を保存.
- RemovedWordInfoTable.txt
- 入力単語選択パネルにおける削除単語テーブルの状態を保存.
- UndefinedWordSet.txt
- 未定義単語リストを保存.
- wordEvalConceptSet.txt
- 自動多義性解消によりランキングされた概念の評価値を保存.「ファイル」→「開く」→「多義性解消結果を開く」メニューから復元できる.
- WordInfoTable.txt
- 入力単語選択パネルにおける正解単語テーブルの状態を保存.「ファイル」→「開く」→「入力単語テーブルを開く」メニューから復元できる.
- WrongPairSet.txt
- 概念定義パネルにおける不正解概念対を保存.
DODDLE-OWLの終了
「ファイル」→「終了」メニューを選択するとDODDLE-OWLのプログラムが終了する.
オプションダイアログ
「ツール」→「オプションダイアログを表示」メニューを選択するとオプションダイアログが表示される.オプションダイアログでは,DODDLE- OWLにおける様々な設定を行うことができる.オプションダイアログは,「基本」,「フォルダ」,「多義性解消」,「複合語」,「表示」の各タブから構成 されている. オプションダイアログの下部にある4つのボタンは,それぞれ,設定の保存,設定の適用,オプションダイアログを閉じるために用意されている.「保存 (File)」ボタンは,オプションダイアログで設定した内容をファイルに保存するために用いる.保存した設定ファイルは,「ファイル」→「開く」→「設 定ファイルを開く」メニューから開くことで,設定の復元を行うことができる.「保存 (Registry)」ボタンは,オプションダイアログで設定した内容をWindowsのレジストリに保存することができる(Unixの場合はXML形式 等でユーザごとのフォルダに保存される).ここで保存した内容は,DODDLE-OWLを再起動後も有効となる.Java Web Start版でDODDLE-OWLを起動している場合は,「保存 (Registry)」ボタンから設定を保存すると良い.zipファイルからDODDLE-OWLを起動している場合は,解凍したフォルダ直下に置いてあ る「config.txt」ファイルの内容が最優先される.このファイルがない場合には,レジストリに保存された設定が有効となる. 以下では,それぞれのタブについて説明する.
オプションダイアログ: 基本タブ

図32: オプションダイアログ:基本
図32にオプションダ イアログの基本タブを示す.基本タブでは,「言語」,「基本接頭辞」,「基本URI」の設定を行うことができる.「言語」では DODDLE-OWLユーザインタフェースのメニュー等の表示言語や概念の見出しが複数言語用意されていた場合のデフォルト言語を設定するために用いる. 「基本接頭辞」では,OWL形式で領域オントロジーを保存する際の基本URIの接頭辞を設定する.「基本URI」では,OWL形式で領域オントロジーを保 存する際の基本URIを設定する.
オプションダイアログ: フォルダタブ

図33: オプションダイアログ:フォルダ
図33にオプションダイアログのフォルダタブを示す.フォルダタブでは,DODDLE-OWLが参照する外部プログラムや辞書データなどのパスを設定する.以下にフォルダタブで設定する項目を示す.
- 日本語形態素解析器
- ChasenまたはMecabのexeファイルを設定.
- SSTaggerフォルダ
- SS Taggerをインストールしたフォルダを設定.
- perl.exe
- perl.exeの実行ファイルを設定.
- xdoc2txt.exe
- xdoc2txtの実行ファイルを設定.
- Sen辞書フォルダ
- Senの辞書フォルダを設定.
- EDR辞書フォルダ
- EDR概念体系辞書とEDR概念記述辞書をDODDLE-OWLが参照する形式に変換したファイルを置いたフォルダを設定.
- EDRT辞書フォルダ
- EDR専門辞書をDODDLE-OWLが参照する形式に変換したファイルを置いたフォルダを設定.
- WordNetフォルダ
- WordNet(ver.2.0)をインストールしたフォルダ内にあるdictフォルダを設定.
- プロジェクトフォルダ
- DODDLE-OWLのプロジェクトファイルを保存する際に最初に開かれるフォルダ.
- 上位概念リスト
- 上位概念リストを保存したファイルを設定.上位概念リストは入力単語を選択する際に参照される.ある入力単語が設定した上位概念の下位概念の見出しとして存在する場合に入力単語テーブルに表示される.
- ストップワードリスト
- ストップワードリストを保存したファイルを設定.ストップワードリストは,入力文書から単語を抽出する際に抽出を行うべきではない単語集合を保存するファイル.
- 複合語抽出スクリプトフォルダ
- 複合語抽出モジュール(TermExtract)用のスクリプトファイルを保存したフォルダを設定.
- Swoogleクエリー結果フォルダ
- (実装中のため現バージョンでは使用しない)オントロジー検索エンジンSwoogleからオントロジーを獲得する際に実行したクエリー結果をローカルにキャッシュする際に用いるフォルダを設定.
- OWLオントロジーフォルダ
- (実装中のため現バージョンでは使用しない)オントロジー検索エンジンSwoogleから獲得したオントロジーを保存するフォルダを設定.
オプションダイアログ: 多義性解消タブ

図34: オプションダイアログ:多義性解消
図34にオプションダイアログの多義性解消タブを示す.多義性解消タブでは,自動多義性解消を行う際のオプションを設定する.自動多義性解消のアルゴリズムについては,自動多義性解消を参照.
オプションダイアログ: 複合語タブ

図35: オプションダイアログ:複合語
図35にオプ ションダイアログの複合語タブを示す.複合語タブでは,多義性解消パネルにおける部分照合単語のオプションを設定する.ユーザがこのオ プションを選択しない場合に,デフォルト状態として,部分照合単語を階層構築時に照合した概念の「下位概念」とするか「同一概念」とするかをラジオボタン で設定できる.
オプションダイアログ: 表示タブ

図36: オプションダイアログ:表示
図36にオプションダ イアログの表示タブを示す.表示タブでは,クラス階層構築パネル及びプロパティ階層構築パネルにおいて,クラスまたはプロパ ティのノードを表示する際に,接頭辞を表示するかどうかを選択することができる.「修飾名を表示」にチェックをいれた場合,クラスまたはプロパティの名前 空間接頭辞がそれぞれのパネルに表示される.
メニューとツールバー
ファイル

図37: ファイルメニュー
図37にDODDLE-OWLの「ファイル」メニューを示す.「ファイル」メニューの詳細は以下のとおりである.
- 新規プロジェクト(Ctrl+N)
- プロジェクトを開く(Ctrl+O)
- 開く
- プロジェクトの処理ごとの状態を復元
- プロジェクトを上書き保存 (Ctrl+S)
- プロジェクトを名前を付けて保存 (Ctrl+Shift+S)
- 保存
- プロジェクトの処理ごとの状態を保存
- 終了
ツールバー

図38: ツールバー
図38にDODDLE-OWLの「ツールバー」を示す.ツールバーのアイコンは左から順番に,「新規プロジェクト」,「プロジェクトを開く」,「プロジェクトを上書き保存」,「プロジェクトを名前を付けて保存」をあらわしている.
ファイル → 開く

図39: ファイルメニュー: 開く
図39にDODDLE-OWLの「ファイル」→「開く」メニューを示す.「ファイル」→「開く」メニューの詳細は以下のとおりである.
- 入力単語リストを開く
- 入力単語リストを保存したファイルを選択し,多義性解消パネルの単語リストに読み込む.プロジェクトファイルの「InputWordSet.txt」.
- 入力単語テーブルを開く
- 入力文書選択パネルの正解単語テーブルを復元.プロジェクトファイルの「WordInfoTable.txt」.
- 概念記述を開く
- 概念定義パネルで定義した概念定義を復元する.プロジェクトファイルの「ConceptDefinition.txt」
- 多義性解消結果を開く
- 自動多義性解消を行いランキングした概念の評価値を復元.プロジェクトファイルの「wordEvalConceptSet.txt」.
- 入力単語と概念の対応を開く
- 多義性解消パネルにおける入力単語とそれに対応する参照オントロジー中の概念のURIとの対応関係を復元.プロジェクトファイルの「InputWordConceptMap.txt」.
- OWLオントロジーを開く
- クラス階層構築パネル及びプロパティ階層構築パネルの各階層を復元.プロジェクトファイルの「Ontology.owl」.
- FreeMindオントロジーを開く
- FreeMindで記述されたオントロジーを復元.あらかじめ,「ファイル」→「保存」→「FreeMindオントロジーを保存」で保存したFreeMind形式ファイルを編集した場合のみ復元可能.
- 概念と代表見出しの対応を開く
- 概念のURIとその代表見出しの対応関係を保存したファイルを開くことで,クラス及びプロパティ階層構築パネルの階層における各概念の表示見出しを設定できる.過去のバージョンとの互換性のためにあるが,DODDLE-OWL Beta2ではskos:prefLabelプロパティを用いて,直接OWLオントロジー中に代表見出しの情報を保存している.
- 設定ファイルを開く
- オプションダイアログで設定した内容を保存したファイルを復元する.
ファイル → 保存

図40: ファイルメニュー: 保存
図40にDODDLE-OWLの「ファイル」→「保存」メニューを示す.「ファイル」→「保存」メニューの詳細は以下のとおりである.
- 入力単語リストを保存
- 多義性解消パネルに設定した入力単語リストをファイルに保存する.
- 入力単語テーブルを保存
- 入力文書選択パネルの正解単語テーブルをファイルに保存する.
- 多義性解消結果を保存
- 自動多義性解消を行いランキングした概念の評価値をファイルに保存.プロジェクトファイルの「wordEvalConceptSet.txt」.
- 入力単語と概念の対応を保存
- 多義性解消パネルにおける入力単語とそれに対応する参照オントロジー中の概念のURIとの対応関係をファイルに保存する.
- 完全照合単語リストを保存
- 多義性解消パネルにおける完全照合単語リストをファイルに保存する.
- 完全照合単語リストと対応する複合語を保存
- 多義性解消パネルにおける完全照合単語リストと各完全照合単語に対して,部分照合単語リストの中でその単語に照合した部分照合単語リストをセットでファイルに保存する.
- OWLオントロジーを保存.
- クラス階層構築パネル及びプロパティ階層構築パネルの各階層をOWL形式でファイルに保存.
- FreeMindオントロジーを保存
- クラス階層構築パネル及びプロパティ階層構築パネルの各階層をFreeMind形式でファイルに保存.
- 概念と代表見出しの対応を保存
- クラス及びプロパティ階層構築パネルにおける概念(クラスまたはプロパティ)のURIとその概念の代表見出しの対応関係をファイルに保存.
- 設定ファイルを保存
- オプションダイアログで設定した内容をファイルに保存.
ツール

図41: ツールメニュー
図41にDODDLE-OWLの「ツール」メニューを示す.「ツール」メニューの詳細は以下のとおりである.
- すべての単語を表示
- 多義性解消パネルに設定されたすべての単語を別ウィンドウで表示する.
- 自動多義性解消
- 自動多義性解消を行い,多義性解消パネルの概念リストに評価値を付加する.
- クラス階層構築
- 多義性解消パネル:階層構築オプションパネルの「クラス階層構築」ボタンと同様.
- クラス及びプロパティ階層構築
- 多義性解消パネル:階層構築オプションパネルの「クラス及びプロパティ階層構築」ボタンと同様.
- ログコンソールを表示
- 標準出力,標準エラー出力をダイアログに表示.
- XGAレイアウト
- XGAの解像度に合わせたレイアウトを行う.
- UXGAレイアウト
- UXGAの解像度に合わせたレイアウトを行う.
- オプションダイアログを表示
プロジェクト
複数のプロジェクトを同時に開いている場合には,「プロジェクト」メニューよりプロジェクト名を選択することで,最前面に選択したプロジェクトを表示することができる.
ヘルプ
「ヘルプ」→「バージョン」で,DODDLE-OWLの現在のバージョンを表示することができる.
参考文献
- Michael K.Smith, C.W., McGuinness, D.L.:OWL Web Ontology Language Guide (2004) http://www.w3.org/TR/owl-guide/.
- NICT(情報通信研究機構): EDR電子化辞書 http://www2.nict.go.jp/r/r312/EDR/J_index.html.
- G.A.Miller: WordNet: A Lexical Database for English. ACM Vol.38(11) (1995) pp. 39–41
- Ding,L., Pan,R., Finin,T., Joshi,A., Peng,Y., and Kolari,P.: Finding and Ranking Knowledge on the Semantic Web, Proceedings of the 4th International Semantic Web Conference, LNCS 3729, pp. 156–170 (2005), http://swoogle.umbc.edu/
- 小出 誠二, 森田 武史, 山口 高平, ムリアディヘンドリー, 武田 英明:WordNetとEDRのOWL表現, 人工知能学会セマンティックWebとオントロジー研究会 SIG-SWO-A601-03 (2006)
- 中山 浩太郎, 原 隆浩, 西尾 章治郎:Wikipediaマイニングによるシソーラス辞書構築手法, 情報処理学会論文誌, Vol.47, No.10, pp. 2917–2928 (2006), http://wikipedia-lab.org/
- Marti A.Hearst, H.S.: Customizing a Lexicon to Better Suit a Computational Task. Corpus Processing for Lexical Acquisition (1996) pp.77–96
- Agrawal, R., Srikant, R.: Fast algorithms for mining association rules. Proceedings of VLDB Conference (1994) pp.487–499