hiroyuki_tの日記
明日からつかえるシンプル統計学 ~身近な事例でするする身につく最低限の知識とコツ (現場の統計学) 「明日からつかえるシンプル統計学 ~身近な事例でするする身につく最低限の知識とコツ (現場の統計学)」読了 Amazon.co.jpアソシエイトによる画像リンクです。書影を利用するために使用しています。 基礎から学ぶ機械学習1冊目 ざっくりとしたまとめ、詳細は本を購入ください。 まずはこれがわかれば十分 まずはこれがわかれば十分として、以下が取り上げられている。 平均・中央値・最大/最小値 標準偏差 各種グラフによる視覚化・比較 相関 単回帰分析 平均・中央値 平均 メリット 全体の大きさを一つの数値で簡単に表現できる(必ずしも真ん中ではない) 一つの計算がしやすい(平均を出すのも使うのも) デメリット 極端に大きい(小さい)データがあると影響を受けやすい 中央値 メリット 全体の大きさを一つの数値で簡単に表現できる 極端なデータの影響を受けず、真ん中の値を取れる デメリット 平均に比べると精度が落ちる 他への拡張がしにくい 平均、中央値を両方記載すると良いことが多い。 標準偏差を実務で使いこなすには 平均値を出し、標準偏差を出し、前回と比較する。 (p42) グラフによる視覚化・比較 折れ線グラフ、棒グラフ、円グラフ、散布図 を適した形で使い分けることが重要 p77に早見マトリックスあり 相関分析 何を図るのか 相関の度合いを図る それはすなわちどういうことか 2種類のデータの関連の強さ(どのくらい直線(比例)的か) 指標 相関係数(0.7以上or -0.7以下だと相関関係あり) 単回帰分析 何を図るのか 近似曲線 それはすなわちどういうことか 2種類のデータの関係性を最もよく示す直線とその数式 指標 決定係数(0.5以上だと妥当な近似曲線が得られたと考える)
1 Oct 2017
基礎から学ぶ機械学習(本の独習による勉強) 統計学・機械学習の勉強について以下を参考にして勉強する計画を立てました。 431日の計画ができました。 初級者向けは、コンピューターで「脳」がつくれるか以外を実施で、今月中に完了を目指します。 中級者向けは1冊 半月 or 1ヶ月用意しています。 初級者向けは行けると思いますが、 中級者向けは読む前に必要な前提知識もあり、かなり厳しいと考えています。 勉強を進めます。 データサイエンティストもしくは機械学習エンジニアを目指すならお薦めの初級者向け6冊&中級者向け15冊(2017年春版)
1 Oct 2017
Design pdevty