「テキストマイニング」の版間の差分

提供: ORWiki
ナビゲーションに移動 検索に移動
 
3行目: 3行目:
 
電子化された文書やWebページなどの膨大なテキストデータから,
 
電子化された文書やWebページなどの膨大なテキストデータから,
 
新たな情報を発掘しようとすることをいう.
 
新たな情報を発掘しようとすることをいう.
構造化されたデータベースからのデータマイニングと異なり,
+
構造化されたデータベースからの[[データマイニング]]と異なり,
 
構造化されてなく非定型なテキストが対象となる.
 
構造化されてなく非定型なテキストが対象となる.
 
また,情報検索が文書の発見を目指すのに対し,
 
また,情報検索が文書の発見を目指すのに対し,

2007年9月20日 (木) 20:45時点における最新版

【 てきすとまいにんぐ (text mining) 】

電子化された文書やWebページなどの膨大なテキストデータから, 新たな情報を発掘しようとすることをいう. 構造化されたデータベースからのデータマイニングと異なり, 構造化されてなく非定型なテキストが対象となる. また,情報検索が文書の発見を目指すのに対し, テキストマイニングはパターンや相関規則(association rule)の発見, 文書分類(document classification), トピック抽出といった新たな知識の発見を目的としている.