2023-01-01から1年間の記事一覧

データサイエンティストが競技プログラミングAtCoderをはじめてやってみた

きっかけ 会社の仕事関係で数理最適化を学ぶことになった。 入門書などを読んで以下のように理解した。 数理最適化は連続最適化と組合せ最適化に大きく分かれる 会社の業務レベルで設計や実装に工夫が求められるのは組合せ最適化のほう(連続最適化は問題の…

阪神タイガースの優勝(アレ)をデータから紐解く

阪神タイガースが18年ぶりにセ・リーグ優勝(以下アレとする)した。データに関するブログなので、今回は阪神のアレをデータから考えてみたい。プロ野球を観ていた方なら、今年の阪神はとにかく投手力が充実していたという話を何度も聞いたはずだ。 一方で、…

誤解しやすい統計・機械学習・データサイエンス用語10選

AIやDXが広まるにつれ、ビジネスの現場で統計や機械学習の用語を耳にすることが増えている。一方、字面からの類推によるものか誤った用語の意味がひとり歩きすることも少なくない。多少意味が間違っていても意思の疎通に問題がなければまだよいが、ときに不…

データ加工スニペットを書いて公開したがよい名前を思いつかない

最近、とあるデータ加工の実装にけっこう頭を悩ませたので、せっかくだからと実装内容を整理してGitHubに公開した。github.comしかし、処理内容を端的に説明するよい名前を思いつかない。実際、最初はChatGPTにやってもらおうと思ったがよい聞き方が思いつか…

データ分析向けのGitHubの使い方について考えて、ChatGPTにも聞いてみた

チーム開発と同様に、チームでデータ分析を進める場合にもGitHubによるソースコードの管理を求められることが多い。目的がデータ分析であれプログラムを作成しているのだからとGitHubを使うことが当たり前に受け入れられがちだが、実際に作業を進めるとGitHu…

元データサイエンティスト採用担当者が未経験からデータサイエンティストになる方法について考える

自分程度の実力・実績のわりに私この業界わかってますよ感が出る気がして、この手の記事を書くつもりはなかったのだが、学生時代の同級生から未経験からデータサイエンティストになるにはどうすればいいのかと聞かれたので、この機会に自らの経験と考えの棚…

イチローの安打数とサッカー1試合あたり得点数とポアソン分布

イチローの1試合あたり安打数はポアソン分布に従いそうに思われるが従わないという記事が少し前に話題になったようだ。 rikei-logistics.com これに対し、ポアソン分布に従わないのは当たり前と指摘する記事も出ていた。 www.anlyznews.com 安打数の分布に関…

会社員をやりながら英国の大学のオンライン修士課程を修了した

昨年の11月にエディンバラ大学の以下のコースを修了した。専攻はデータサイエンス系である。 関心がある人向けの情報共有を兼ねて、個人的な体験から大変だったことや学んだことをまとめておく。www.ed.ac.uk 事務とのやりとり 大学の事務は冷淡でお役所仕事…