qnqn雑記

個人の学習ログの域は超えておりませんので間違っている可能性があり確かな情報を求められる場合は専門書等々に当たってください。体系的な情報については管理者ホームページへ(https://qnqn1927.github.io/)

statistics

一度観測してからサンプルサイズを積むとp-hackingになるシミュレーション

一度観測してからサンプルサイズを積むとp-hackingになるシミュレーション 要旨 twitterで話題になってたので自分でもやってみた pythonで実施 マジで誤謬の確率が高くなる よくよく考えると 実験→検定→p値観測→分岐発生 [A]0.05より大きい→サンプルサイズ貯…

plotly

plotly plotlyの素晴らしさに惚れたので備忘 こうやって出力されたグラフをぐりぐり動かせたりします。 便利そうなグラフ垂れ流し import pandas as pd import numpy as np import plotly.express as px import plotly.graph_objects as go import plotly.fi…

因果推論の手法群

備忘レベル 様々な手法 それぞれエビデンスレベル(証拠としての信頼度の高さ)が異なる ランダム化比較試験 自然実験 擬似実験 擬似相関に注意する まったくの偶然 第3の変数 逆の因果 擬似実験 差の差分析 操作変数法 回帰不連続デザイン マッチング法 分…

pythonでやる独立性の検定

前提 グラフの描画はseabornを使います pythonスクリプト import pandas as pd import scipy.stats as st import matplotlib.pyplot as plt import seaborn as sns df = pd.DataFrame(columns=['value1','value2']) df.loc['A'] = [500,301] df.loc['B'] = […

統計学の理解に必要になる数学知識まとめ

とりあずまとめ 単元 項目 補足 数列 Σ記号 記号の意味と法則が必要 微分・積分 微分計算のルール 記号の意味と法則の理解が必要。ライプニッツ記法 微分・積分 偏微分 記号の意味の理解。∂(ラウンドディー) 微分・積分 積分計算のルール 微分・積分 ネイピ…

統計学用語集

用語 説明 補足 平均(mean) N個のデータの合計値をデータの個数Nで除算したもの 偏差(deviation) N個のデータそれぞれの平均値との差 分散(variance) 偏差を2乗し平均をとったもの 標準偏差(standard deviation, SD) 分散に√をとったもの 正規分布(…