qnqn雑記

個人の学習ログの域は超えておりませんので間違っている可能性があり確かな情報を求められる場合は専門書等々に当たってください。体系的な情報については管理者ホームページへ(https://qnqn1927.github.io/)

Kaggleのcodeで迷子にならないためにアンカーリンクを作る

概観

  • markdownセルである記述をするとmarkdownの見出しへのアンカーリンクが作れる

    • 形式は次のとおり
      • [表示名](#リンク先の見出しの名前)
      • リンク先ですが空白は「-」で繋げばOKです
    • 記入例
      # Example Anchor Links
      [#Anchor1](#Anchor1)
      [#Anchor2](#Anchor2)
      [#Anchor3](#Anchor3)
      [#Anchor4](#Anchor4)
    
      [#feature-engineering](#feature-engineering)
      [#cross-validtion](#cross-validation)
    
      [#Training](#Training)
      [#Inference](#Inference)
    
  • codeが長くなってくると迷子になりがちなので便利

  • 補足
    • 見出し自体は通常通り# Anchor1markdownセルで作れば良いです
    • 大文字小文字は区別されます(case-sensitive

細かく書き続ける

  • ブログを立ち上げたがやっぱり続かない
  • どうすれば続くのか?
    • 細かく書き続けて持続させることがよさそう?
    • notionにたくさんメモってはいる
    • 外に吐き出すメリットは?
    • →悩みすぎて停滞は良くない
    • →書いてみて前進する、書いてから考える
  • 制約として階層構造は持たせたい
    • 頭の中が非常に整理される気がしている

Diagrams.netの良さ

現在、決定木の各指標を整理中。 そんな時、diagrams.netの良さが際立つ。 こんな感じで思考整理できます。

f:id:qnqn1927:20211205155754p:plain

こうすると非常に記憶に残る・・・なぜなんだろう。 位置関係なのかな。 とりあえず頑張ってまとめる^^

VisualStudioCodeのおすすめ設定

Hot Exit

デフォルトでONのようです。 編集途中の文書ごとエディタを閉じても、裏側で保持してくれて、再度立ち上げた際に状態を復元してくれる良いオプション。

Startup Editor

noneとすると空の文書でエディタが立ち上がる

kaggle - Intermediate Machine Learning Lesson 2

Missing Values

3つのアプローチがある

  • A Simple Option: Drop Columns with Missing Values(欠損値を含む列の除去)
    • 欠損値がある列の値を消す
    • 当該列の値の大半が欠損値であれば特に問題がないが、そうでなければ、重要な情報まで取り除いてしまう可能性が高い
  • A Better Option: Imputation(インピュテーション)
    • インピュテーション。統計学において欠損値を別の値で補うことを指す。
    • 今回のレッスンでは当該列の平均値で補っている
  • An Extension To Imputation(インピュテーションの拡張)
    • インピュートされた値は実際の値より上振れたり下振れたりしている可能性がある
    • どの値が元々欠損していたかの目印となる列を追加することで、モデルがより良い予測を行える可能性がある
    • 結果が大きく改善される場合もあれば、全く役立たない場合もある