みぞメモ

ブログ作成用のメモ登録

データの分析と知識発見('16):テキスト 目次

1.はじめに
1.1 データ分析のプロセス
1.2 R と RStudio
1.3 数値誤差について
1.4 まとめと展望

2.関数とパッケージ
2.1 基本的な統計量の計算
2.2 関数の引数と変数の範囲
2.3 パッケージ
2.4 まとめと展望

3.多次元データとファイル操作
3.1 共分散と相関
3.2 行列、リスト、データフレーム
3.3 R でのファイル処理
3.4 まとめと展望

4.データの視覚化
4.1 グラフ
4.2 散分布図 (scatter plot)
4.3 ヒストグラム (histogram)
4.4 円グラフ (circle graph)
4.5 棒グラフ (bar chart)
4.6 関数の描画
4.7 まとめと展望

5.表の作成
5.1 クロス集計表
5.2 多重クロス表
5.3 クロス集計表の指標
5.4 R でのデータの集計
5.5 データの型
5.6 まとめ

6.検定
6.1 仮説検定
6.2 確率分布
6.3 代表的な確率分布
6,4 カイ2乗検定
6.5 まとめと展望

7.回帰分析
7.1 回帰分析
7.2 重回帰分析
7.3 予測の正確さ
7.4 偏相関係数
7.5 R によるシミュレーション
7.6 まとめと展望

8.主成分分析
8.1 主成分分析の概要
8.2 主成分の導出
8.3 一般の場合 8.4 2次元の場合の例
8.5 まとめと展望

9.多次元尺度法
9.1 距離の公理
9.2 多次元尺度法の概略
9.3 2次元での例
9.4 R によるシミュレーション
9.5 まとめと展望

10.因子分析
10.1 因子分析の概要
10.2 因子分析の定式化
10.3 因子負荷量の計算手順
10.4 因子の回転
10.5 R によるシミュレーション
10.6 まとめと展望

11.クラスター分析
11.1 階層的クラスター分析
11.2 R によるシミュレーション(1)
11.3 非階層的クラスター分析
11.4 R によるシミュレーション(2)
11.5 まとめと展望

12.アソシエーション分析
12.1 POSシステム
12.2 アソシエーションルール
12.3 R によるシミュレーション
12.4 まとめと展望

13.決定木
13.1 木構造とデータの分割
13.2 不純度とジニ係数
13.3 R によるシミュレーション
13.4 まとめと展望

14.ニューラルネットワーク
14.1 神経細胞の振る舞いとニューロンのモデル
14.2 バックプロパゲーション
14.3 汎化能力と過学習
14.4 R によるシミュレーション
14.5 まとめと展望

15.テキストマイニング
15.1 形態素解析
15.2 R を用いたテキストマイニング
15.3 頻度ファイルに基づいた文書の分類
15.4 まとめと展望

以上