Technical Notes ▼
- IDE ▼
  - IntelliJ
- PhysicalSimulation ▼
  - mechanics ▼
    - 質点の運動
- DataMining ▼
  - 時系列データ分析 ▼
  - geolocation ▼
    - GeoJSON
- Network ▼
  - ssl-server-certificate ▼
    - CSR
    - ルート証明書
  - ネットワーク用語
- Management ▼
- Others ▼
  - Software ▼
    - Slack
  - Jekyll
  - Tex 数式
- Principle ▼
  - ソフトウェアテストの7原則
- Language ▼
  - HTML-CSS ▼
    - HTML / CSS 逆引き
  - Python ▼
    - Library ▼
      - SciPy
      - pickle
      - mecab-python3
      - PyAudio
      - matplotlib-venn
      - geopandas.md
      - statsmodels
      - datetime
      - matplotlib
      - streamlit.md
      - Fabric
      - Pillow
      - pandas
      - graphviz
      - numpy
      - jinja2
      - qdm
      - Flask
    - "[Python] スクレイピング"
  - Assembly ▼
    - レジスタ
  - Java ▼
    - JMX
    - Library ▼
      - JUnit
      - Selenium
      - Mockito
      - Quartz
      - Jersey
      - Jackson
      - Log4J
      - HttpClient
    - Java 実行時オプション
    - Java 修飾子
  - Scala ▼
  - JavaScript ▼
- Algorithm ▼
  - recommendation ▼
    - 行列分解
    - Factorization Machine
  - 線形計画法
  - equation ▼
    - 二分法
    - ニュートン法
  - sort ▼
  - data-structure ▼
    - ブルームフィルタ
  - graph ▼
  - 高速フーリエ変換（FFT）
  - differential-equation ▼
    - partial-differential-equation ▼
    - オイラー法
  - information-retrieval ▼
    - 転置インデックス
  - string ▼
    - Suffix Array
  - 最小二乗法
- Math ▼
  - 統計学 ▼
    - time-series ▼
    - 大数の法則
    - 尖度
    - ローレンツ曲線
    - モーメント母関数（積率母関数）
    - correlation ▼
    - チェビシェフの不等式
    - 順序統計量
    - distribution ▼
    - Q-Q プロット
    - 同時確率分布
    - 中心極限定理
    - estimation ▼
    - 歪度
    - 統計学の公式
    - regression-analysis ▼
      - 線形回帰
    - 独立な確率変数の和
    - hypothesis-testing ▼
    - 分散共分散行列
  - graph ▼
    - ラプラシアン行列
  - formula ▼
    - スターリングの公式
  - special-functions ▼
  - calculus ▼
    - ラグランジュの未定乗数法
    - ロピタルの定理
    - complex-analysis ▼
    - フーリエ変換
    - vector-calculus ▼
    - テイラー展開
    - 畳み込み積分
    - 微分積分の公式
    - differential-equation ▼
      - boundary-condition ▼
        
        ノイマン境界条件
        
        ディリクレ境界条件
      - special-equation ▼
        
        ポアソン方程式
        
        波動方程式
        
        拡散方程式
  - matrix ▼
    - 特異値分解
    - 次元定理
    - 固有値と固有ベクトル
    - 行列の階数
    - 逆行列
    - 広義の固有ベクトル
    - 行列式
    - 直交変換
    - 行列の対角化
    - special-matrix ▼
    - 行列のトレース
    - ジョルダン標準形
- Standard ▼
  - Swagger
- ML ▼
  - k-means
  - 最適化アルゴリズム
  - ロジスティック回帰
  - 正則化
  - k 近傍法
  - Preprocess ▼
  - 決定木
  - DBSCAN
  - サポートベクトルマシン
  - ensemble-learning ▼
  - gbdt ▼
  - ADALINE
  - RANSAC
  - パーセプトロン
  - Evaluation ▼
  - AdaBoost
  - 多層パーセプトロン
  - 凝集型クラスタリング
  - reinforcement-learning ▼
- Linux ▼
  - System ▼
    - サーバのボトルネック調査
  - Command ▼
    - ast
    - nice
    - nslookup
    - screen
- Reading-Notes ▼
- OSS ▼
  - JMeter
  - Prometheus
  - Hive
  - InfluxDB
  - Gatling
  - Solr ▼
    - apache-solr-introduction ▼
    - トラブルシューティング
  - Trino (Presto)
  - Hadoop ▼
    - HDFS
    - HttpFS
  - Cassandra
  - Grafana
  - fluentd
  - Spark ▼
- NLP ▼
  - 文字列の類似度
  - TF-IDF
  - morphological-analysis ▼
    - MeCab
  - Word2Vec
- Tool ▼

線形回帰とは

実際に得られた標本から、目的変数 $Y$ を説明変数 $X$ の一次式で表現する回帰分析の手法。

\[Y = aX + b \tag{1}\]

回帰方程式の導出

目的変数 $Y$、説明変数 $X$ の $n$ 件の標本 $(x_1, y_1), \cdots, (x_n, y_n)$ が得られているとする。
$X, Y$ の間の関係性を表すモデルとして線形関係 $(1)$ を仮定するとき、最小二乗法によりパラメータ $a, b$ を求める。

標本 $(x_k, y_k)$ に含まれるモデルからの誤差は

\[\varepsilon_k := y_k - (a x_k + b)\]

残差平方和：

\[S := \sum_{k=1}^n \varepsilon_k^2 = \sum_{k=1}^n (y_k - a x_k - b)^2\]

を定義し、これを最小化するようなパラメータ $a, b$ を求めれば良い。

$X, Y$ の標本平均を $\bar{x}, \bar{y}$ として、

\[\begin{eqnarray} \cfrac{\partial S}{\partial a} &=& -2 \sum_{k=1}^n x_k (y_k - a x_k - b) \\ &=& -{2} \left( \sum_{k=1}^n x_k y_k - a \sum_{k=1}^n x_k^2 - b n \bar{x} \right) \\ \\ \cfrac{\partial S}{\partial b} &=& -2 \sum_{k=1}^n (y_k - a x_k - b) \\ &=& -2 \left( n \bar{y} - an \bar{x} - nb \right) \end{eqnarray}\]

これらをゼロと置いた解が求める $a, b$ であるから、

\[\begin{eqnarray} a &=& \cfrac{ \sum_{k=1}^n x_k y_k - n \bar{x} \bar{y} }{ \sum_{k=1}^n x_k^2 - n \bar{x}^2 } = \cfrac{ \sum_{k=1}^n (x_k - \bar{x}) (y_k - \bar{y}) }{ \sum_{k=1}^n (x_k - \bar{x})^2 } = \cfrac{Cov(x, y)}{V(x)} \\ b &=& \bar{y} - a \bar{x} = \bar{y} - \cfrac{Cov(x, y)}{V(x)} \bar{x} \end{eqnarray}\]

線形回帰に帰着できる非線形回帰モデル

弾性モデル

\[Y = \beta X^\alpha\]

両辺の対数を取ると、

\[\log Y = \log \beta + \alpha \log X\]

以下の置き換えにより線形回帰の式 $(1)$ にできる。

$\log Y \to Y’$
$\log X \to X’$
$\log \alpha \to a$
$\log \beta \to b$

指数回帰

\[Y = \beta \alpha^X\]

両辺の対数を取ると、

\[\log Y = \log \beta + X \log \alpha\]

以下の置き換えにより線形回帰の式 $(1)$ にできる。

$\log Y \to Y’$
$\log \alpha \to a$
$\log \beta \to b$