テキストマイニング

提供: ORWiki
ナビゲーションに移動 検索に移動

【 てきすとまいにんぐ (text mining) 】

電子化された文書やWebページなどの膨大なテキストデータから, 新たな情報を発掘しようとすることをいう. 構造化されたデータベースからのデータマイニングと異なり, 構造化されてなく非定型なテキストが対象となる. また,情報検索が文書の発見を目指すのに対し, テキストマイニングはパターンや相関規則(association rule)の発見, 文書分類(document classification), トピック抽出といった新たな知識の発見を目的としている.