What one likes, one will do well 〜好きこそ物の上手なれ〜

寄り道しながらも、最後は昔から好きな物理とプログラミングに戻ってくる。そんな男の思いをつづるブログです。

2023年5月の振り返り

5月の目標は以下でした。結論から言うと、6つの目標中3つ達成で、50%の達成率です。1つずつ達成状況を確認します。

 

 

統計検定1級合格に向けて勉強を継続する(コミュニティに入ったので、そこの課題を継続する)

現代数理統計学の基礎を1日1,2問課題として、解いています。今まで一人でやろうと思っても継続できませんでしたが、コミュニティのおかげで継続できています。質問や議論もできて、とても良い環境になっています。

 

統計検定1級の過去問を1回解いて、難易度を把握する

1回分は解けていないのですが、1問だけ解きました。その1問だけであれば、手が出ないということはなかったのですが、解くのに時間がかかりました。後は他の問題はどうなのかわからない状況です。

こちらは未達ですね。。。

 

AtCoder ABC2回以上参加(土曜日の夜があくようになったので)

Ratingの結果はひどいものですが、5月はABC2回、ARC2回参加しました。

緑から茶色になってしまいましたが、参加するのは楽しいです。精進する時間は取れていませんが、今は参加することが大切かなと思っています。

 

キャッシュフロー整理(自動送金などの設定含める)

家計のお金の流れは整理しました。自動送金の設定をして、必要なお金は別でとっておけるようにしています。

 

7つの習慣読了

第2部私的成功まで読みました。約半分です。読書する時間を取れてないのは課題です。こちらは未達。

 

フィットネス2回目行く

こちらは行けてません。気持ちはあるのですが、なかなか。。。来月こそは。。。

 

振り返り結果を踏まえて、6月の目標を立てたいと思います。

統計検定準1級合格体験記

はじめに

2023年1月30日に統計検定準1級に合格しました。
合格までの勉強内容や受験した感想を紹介します。

自分のスペック

  • 2021年5月に統計検定2級合格
  • 数学は得意な方。大人になってからも線形代数や物理の参考書を買って勉強していた
  • 統計学や械学習関連の書籍を以前に読んだことがある(統計学入門、はじめてのパターン認識、データ解析のための統計モデリング入門、ベイズ深層学習など)。ほぼ覚えていませんが。。。
  • Kaggleやってる(Expert)
  • 仕事でデータ分析をしている(ただ統計学を使うかというとそこまででもない)

使用した参考書

問題は解いていませんが、本文の証明や式はノートに書きながら一つずつ確認しました。
9章まで読み終わらせる予定でしたが、時間がなく9章の途中で過去問に移りました。
試験範囲を見ると9章までやっておけばよいと思います。
9章の最後は頻出部分だと思うので、最後までやり切ればもっと良かったです。

6年分の過去問が収録されており、記述、選択式に取り組みました。論述式は解いていません。
3年分が2周、残り3年分は1週で時間切れでした。
時間を計ってやっていましたが、最後まで90分では解ききれず2時間以上かかっていました。

勉強時間

統計検定2級に合格してから、準1級の勉強を始めたのですが、本格的に始めたのは2022年4月からです。
ただ6月頃から仕事が忙しくなり中断し、落ち着いた11月から再開しました。
2022年4月からの勉強時間は以下です。

  • 現代数理統計学の基礎: 約40時間
  • 統計検定準1級公式問題集: 約25時間

試験の内容

問題数21問。回答は選択式が基本ですが、中に記述式(4,5問程度)があります。記述式は1問に小問(2問程度)がある形でした。
記述式は、計算結果などの数値を直接書く問題です。ただ選択肢の数字を書く問題が多く、実質選択式の問題がほとんどでした。数問は計算結果の数値を書く問題がありました。
難易度は、過去問と同程度でしたので、過去問をやっておけば対応できると思います。似た問題も何問かでました。
試験時間ですが、過去問は約35問で、本番は小問入れて約25問だったので、過去問で時間内に終われなくても対応できました。本番は、わからない問題は飛ばして後回しにしたのもあり、20分程度残り最後は見直ししました。

試験の結果

64点でなんとか合格しました。(合格点60点)

感想

現代数理統計学の基礎で理論をしっかりと勉強できたのはよかったです。ただ準1級の合格に、各理論の証明までの理解は必ずしも必要ではないかなと思いました。試験対策だと過去問が一番だと思います。
準1級の合格には実務で統計学を使う力が必要かなと思います。
統計学を実際に適用する際にどう適用するのかを理解できている必要があり、実務経験があると解きやすいと思います。
ただ範囲が広くすべての手法を使ったことがある人は多くないと思うので、過去問で補っていく必要があります。
過去問を通して、こうやって統計学を使うのかと発見する部分が多く、実務で活用していけるといいなと感じました。

今後に向けて

統計検定準1級に合格したので、次は1級に挑戦したいと思います。
1級は論述式で11月開催予定なので、今から準備を始めたいと思います。
また統計検定の資格取得で終わらずに、統計を実務で活用していきたいと思います。

ブログ再開

最近生活の変化がたくさんあって、色々と考えさせられることがありました。その話はおいおいしていこうと思います。

そんな中、最近はアウトプットができていなかったなと痛感しました。前回の記事が2021年1月、その前が2020年の2月。年1回更新ペースで全然ですね。。。

新しい技術や資格取得などで何かとインプットはしていたので、それに伴うアウトプットをしていこうと思いました。

 

何をインプットして、何をアウトプットしていくのか。今日はそれを整理しようと思います。パッと思いつくのは以下です。

  • Kaggle
    • データ分析スキルを上げるためには実践が一番です
  • AtCoder
  • 統計検定
    • データ分析の基礎になります
  • データエンジニアリング
    • データ分析するにはデータがないと始まりません。今の仕事とも関係のある内容です

思いつくのは上記なのですが、優先度をつけてやっていきたいと思います。子育て期だと時間は十分に取れないですからね。。。

  1. データエンジニアリング
  2.  統計検定
    • 準1級を目指します。現代統計数理学の基礎⇒過去問⇒受験 の流れで行きたいと思います
  3. Kaggle
    • できればコンペに参加したいと思っています。ただ、かなりの時間を取られるので、やりきれない場合が多く、すぐにやるかは未定です。。。
  4. AtCoder
    • ABCの土曜21時は子どもの送迎で、ほぼ参加できないので、もう少し落ち着いてから参加したいと思っています

当面は1, 2をやっていきたいと思います。アウトプットすることによる学びはインプットだけの何倍にもなると思いますので、ブログの再開を期にアウトプットしていきたいと思います。

2020年の振り返りと2021年の抱負

毎年振り返りと抱負をブログにアップしていると思ったら、2020年はしていなかったようです。。。2021年は抱負を設定してやっていきたいと思います。では、早速いきます。

2020年の振り返り

2020年はコロナの影響が大きかったです。そんな中でもよかったこと、よくなかったことを振り返っていきます。

よかったこと

  • 仕事の完全テレワーク化
  • 仕事内容が変わった中で、新しいシステムの立ち上げ
  • クラウドの知識アップ
  • 子どもの送り迎え
  • 家事比率アップ
  • ヨビノリ

よくなかったこと

  • データ分析の時間減少
  • 資格やKaggleの目標未達成
  • 通勤時間なしによる、勉強時間の減少

コロナの影響でよかったことは仕事が完全にテレワーク化したこと。その中で通勤時間がなくなり、ライフに時間を割く時間が多くなりました。

子どもの送り迎えは私が担当するようになりました。バスで行くのですが、当初は手を全然振ってくれなかったのですが、毎日大げさに手を振っていたら、最近では子どもから進んで手を振ってくれるようになりました。

また家事の比率があがって、朝ごはんは私が担当になりました。子どもが朝早くでるようになったので、仕事もテレワークで朝の時間ができたし、朝に強い私が必然的に担当になった形です。通勤時間があったら、今の生活は大変だったと思うので、とても助かっています。

そんな朝ごはんの準備の中で、Youtubeヨビノリを見るのが楽しみなりました。大学の数学や物理の解説を行う番組で楽しくみさせてもらっています。この番組を見ることで、数学や物理を勉強するモチベーションがあがって、少しでも勉強する時間を確保するようになりました。

ワークでは、テレワークになり、しかも仕事が変わりました。そのため上司と会うこともなく新しい仕事が始まりました。そんな中でも新しいシステムを立ち上げまでもっていけたことは良かったです。リモートでも問題なく仕事ができるなと感じた一年でもありました。

またメインの仕事とは別にクラウドに関わる機会が増えました。AWSやAzureで、仕事で関わるとなり、チュートリアルやドキュメントを読み漁って勉強しました。クラウドの利便性を痛感して、もっと活用できるようになりたいと思いました。

 

一方、よくなかったことです。テレワークで通勤時間がなくなったことは、良いことをたくさん産んでくれたのですが、通勤時間に勉強していた私は勉強時間がガクンと減りました。また朝ごはんの担当になって、朝早く起きて自分の時間というのも減った影響も大きいです。そのため資格だったり、Kaggleだったりに掛けられる時間が減り、目標も未達です。

またワークでは、仕事が変わりデータ分析に関わることがほとんどなくなりました。今の仕事の中でデータ分析の知識を活用していこうと思ってはいましたが、現実は何もできなかったです。。。

 

と、2020年を振り返ったところで、2021年の抱負です。

  • データ分析の活用
  • クラウドの活用
  • 子どもの送り迎え、家事の継続
  • 勉強時間の確保
  • 資格の取得

データ分析の活用

ワークではデータ分析の活用をしていきたいです。現場で活用することが最重要だと思っていますので、新しく立ち上げたシステムのデータを活用して、付加価値をつけていきたいです。

クラウドの活用

クラウドファーストという言葉があるように、クラウドの活用をしていきたいです。特にSaaSを利用して、作らずにサービス提供をしていきたいと思います。

子どもの送り迎え、家事の継続

テレワークも継続されますし、これは継続していきたいと思います。コロナが落ち着いて、テレワーク率が減る雰囲気になっても、今の状態が継続できるようにしたいです。

勉強時間の確保

データ分析しかり、クラウドの活用しかり、この後の資格の取得しかり、勉強時間を確保しないと新しいことにキャッチアップしていけないです。朝も忙しいのですが、朝の少しの時間、夜の寝る前など、子どもが成長して少しずつ自分の時間を確保できるようになってきました。その時間を勉強に当てていきたいと思います。

どれだけやったか分からなくなりがちなので、記録もつけて行きたいと思います。

資格の取得

自分の成長を結果として残せるように、今年は資格の取得にも力を入れていきたいと思います。以下のようなものを考えています。

  • 統計検定
    まずは2級からで、準1級を目指せるまでになりたいなと思います
  • AWS、Azure
    まずは基礎的なものからで、管理者系やデータ分析系もとりたいです
  • TOEIC
    まずは受験からです。ずいぶん受けていません。。。

2020年の振り返りと2021年の抱負でした。今年も一年頑張っていきたいと思います。

質実剛健・自主自律

質実剛健・自主自律

 

高校の校訓でした。高校の同窓会紙で久しぶりに見て、子育てに関連して思うこと、自分自身について思うことがありました。そして、これからの座右の銘にしていこうと感じたので、その気持ちを忘れないようにブログを書きます。

 

子育てで悩む一つとしてしつけがあると思います。育児雑誌を読むと、「ほめて育てる」みたいな言葉をよく見ます。一方で甘やかし過ぎないよう叱ることや厳しくすることも必要だと思います。

相反する意見があり、しかも「ほめる」「叱る」「厳しくする」が強調されて、本来の子育てで目指すところが見失いがちになると思います。

ある講演の受け売りですが、私が子育てで目指すところは、「子どもがジリツ」することです。恥ずかしながら「ジリツ」に「自立」と「自律」があることは今回ブログを書き始めて知りました。

自立と自律の意味・違い|5分でわかりやすく!カンタン解説【仕事の例】 | みんなのキャリア相談室

校風の「自主自律」にある通り、目指すところは「自律」、むしろ「自主自律」だと感じました。

「自主自律(じしゅじりつ)」の意味や使い方 Weblio辞書

リンク先にある通り、「自発的に自分自身で考えて行動し、自分自身の規範に従って己を律すること」です。表現が適切かわかりませんが、子どもには「一人前の大人」になって欲しい、それが「自主自律」であると感じました。

子育てで目指すところが、子どもの「自主自律」であるなら、「ほめる」「叱る」など手段に注目するのではなく、「自主自律」を実現できるようにしつけるのが重要だと思います。目指すところが明確であるなら、しつけでどうすれば分からなくなっても、目指すところを思い出しなおせばよいと思います。

 

次に「質実剛健」です。こちらも今回のブログを書くにあたって、再度調べなおしました。

質実剛健(しつじつごうけん)の意味・使い方 - 四字熟語一覧 - goo辞書

「中身が充実して飾り気がなく、心身ともに強くたくましいさま。」です。

中身がないのに表面上よく見せることより、中身が充実している方がよいです。そして生きていく上では、心身ともに強いことが重要です。気持ちを強く持ち、肉体的にも健康で強くあることで、できる幅が広がると思います。

子どもにそうあって欲しいと願うとともに、自分もこうありたいと感じました。

 

今更ながら高校の校訓の意味を知り、自分の座右の銘としたいとまで感じました。子育てしているので、子どもにそうあって欲しいし、そうなるように子育てをしていきたいと思いました。それとともに自分自身の座右の銘としても心にとどめておきたいと思います。

Kaggle宇宙コンペで銅メダルとりました

はじめに

しばらく時間が経ってしまいましたが、Kaggleの宇宙コンペで銅メダルを取ったので、その記録です。初メダルでとても嬉しかったです。

 

 

宇宙コンペ

宇宙コンペは星の光の変化データから、どのような星かを予測するコンペでした。

星の最後の大爆発である超新星だったり、点滅する星の変光星だったりを予測します。

一言に超新星変光星と言っても色々種類があり、予測する種類は14種類となかなか数が多いと思います。しかも学習データにはない、その他の星も予想する必要があり、考えることが多いコンペだったと思います。

 

解法

私の解法としては、大きくは以下の通りです。Kernelにスコアが高い解法が公開されてましたので、それをベースに変更を加えた形になります。

特徴量の事前抽出

光の変化データはデータサイズが大きく、そこから特徴量を抽出するには時間がかかりました。そのため事前に特徴量を計算しておき、その後にどの特徴量を使うか取捨選択しました。繰り返し学習-精度確認のサイクルを回すために役に立ちました。

LightGBMで特徴量の取捨選択

Kernelをforkして、特徴量を追加・削除しました。ローカルのCVを見ながら行い、時々submitして、LBを確認しました。追加するだけでなく、不要な特徴量を減らすことも効果がありました。

1.080のKernelを参考に、特徴量の追加・削除で0.988まで精度が向上しました。(さらにSEEDを変化させて単純平均を取ると0.983)

特徴量の追加・削除、精度確認を地道に行うことは重要なんだなと感じました。

NN(MLP)でのパラメータチューニング

KerasでNN(MLP)モデルを作成し、特徴量はLightGBMから多少取捨選択しました。試行錯誤により、パラメータチューニングしました。精度1.128とLightGBMよりも0.140悪かったですが、アンサンブルで効果がありました。

アンサンブル

LightGBMとNNをアンサンブルを最終のsubmitとしました。1:1だとLightGBMのシングルモデルより悪く、最後にえいやで3:1とすると0.963と精度が上がりました。本当に最後のsubmitだったので、精度が上ったのはラッキーでした。

 

結果

結果は95位で、初銅メダルをゲットしました。前回のTrackMLでは、最終Public LBが100位で、Private LBが101位と後1位でメダルを逃したので、今回もPrivate LBを見るまではドキドキだったので、ゲットした瞬間はガッツポーズしてしまいました。

ちなみにPublic LB 0.963で、Private LB 0.977でした。アンサンブルしてないシングルモデルだと、メダル圏外だったので本当にラッキーでした。

  

さいごに

初メダルは嬉しかったですが、まだKernelをいじって、少し精度上げる程度なので、金銀メダルは程遠いと感じました。もっと精進して、金銀メダルに届くようになりたいと思います。

 

今年の抱負

はじめに

今年も半分が終わろうとしてますが、延び延びになっていた今年の抱負を書こうと思います。

ちょうど気持ち的に切りがよく、次に向けて進める環境が出来上がってきたためでもあります。

 

健康第一

健康でないと何もできません。そのため最近は以下のことに気をつけてます。

  • 早寝早起き。9時に子どもと一緒に寝て、4時に起きてます。
  • 禁酒。最近やめました。お酒飲むと次の日体調が悪くなるので。
  • 禁間食。体重増えてきたので、間食我慢してます。食べたくなるけど、少なくとも仕事中と夜は食べないようにしてます。

本当はさらに運動をするのが良いと思ってるけど、そこまで出来てません。小学校のPTAでソフトボールを少しだけやってるけど、それぐらいです。そのうちダンス復活したいとは思ってます。

 

家族優先

家族を第一に考えていきたいです。仕事は定時に終わらせて、早く家に帰る。最近は職場環境に恵まれて、出来ています。今後も継続したいです。

また子どもに投資していきたいと思います。勉強であったり、スポーツであったり、成功体験できる機会を与えていきたいと思います。

 

自己啓発

自分を高めていく行動はしていきたいです。

実際に4時起きして、自分の時間を作り、スキルアップやアウトプットに精進しています。

特に見える形で結果が大切なので、以下の目標をおきます。

  • Kaggle。銀メダル取得。銅メダルまでは取りましたが、銀メダルは取得できるイメージがつきません。今年中にゲットしたいです。
  • AtCoder。水色。緑で低迷&Kaggle優先してるため時間も取れてません。少しずつ精進して、水色までは今年中にいきたいです。
  • ブログ。書く書くといいながら、カクカクサギなのですが、改めて経験したことや結果をアウトプットしていきたいです。
  • クラウドワークス。気が向いて、一案件やりました。納期があったり、責任が伴ったりと、ただ勉強するのとは緊張感が違います。自分のスキルアップ、かつ、実績にもなるため、これからも挑戦していきたいと思います。

 

おわりに

基本的に自分がやりたいことは大きく変わってないのですが、優先順位が変わってきました。健康や家族が一番になり、自分のことはその後。同じことは元々思ってはいたのですが、明確に言葉にするようになり、その思いが強くなったと思います。

この気持ちで1年(あと半年ぐらい)頑張りたいと思います。