Pytorch
お疲れ様です。 今回は画像分類モデルが分類の判断に使用する特徴量を可視化してみる回です。 モデルがどのように画像の特徴をとらえているかをおおまかに知ることができ、例えばデータセットの見直しなどでモデルの精度改善の検討ができるようになるかと思…
お疲れ様です。 画像分類モデルのSEResNeXtについてのメモです。 個人的にCNNベースの画像分類のモデルアーキテクチャとしてはEfficientNetV2と並んでよく使います。 論文 SEResNeXtの重要なアーキテクチャであるSEブロックに関する論文です。 後の概要にも…
お疲れ様です。 SAM3の実行環境をWSL+Dockerで作成し、実際に実行して試してみた記録です。 SAM3について ai.meta.com 2025年11月にリリースされたSAM(Segment Anything Model)シリーズの最新モデルです。 SAM3では、プロンプトで画像内の検出したい物体を…
お疲れ様です。 今回はPytorchで学習の途中再開をするためのコードのメモです。 長期間モデル学習を実行する際に予期せぬトラブルで処理が止まってしまった場合などにも使えると思います。 ソースコード 以前作成した画像分類のプロジェクトに実装しています…
お疲れ様です。 今回はPytorchでの処理を実装している際に実際に出くわしたエラーについてのメモ。 torchvisionで発生したOverflowErrorについて調べました。 エラー内容 torchvisionのGitHubのissuesに情報がありましたので、載せておきます。 github.com …
お疲れ様です。 最近の実装で知ったPytorchにおけるモデルのload_state_dict時にstrict=Falseを指定したときの仕様についてメモを残しておきます。 docs.pytorch.org strict=Falseの指定について load_state_dictでは基本的にモデルアーキテクチャ(nn.Modul…
お疲れ様です。 商用利用可能で性能のよいセグメンテーションモデルが必要になったので調査した内容をメモに残しておきます。 リンク 概要 実装 リンク 論文 arxiv.org 論文解説 speakerdeck.com 公式実装 github.com 概要 以下は生成AI(Gemini)に聞いた内…
お疲れ様です。 今回は機械学習の界隈で話題のRAdamScheduleFreeという新しいoptimizerを試したいと思います。 なんでもAdamWと同等かそれ以上の性能だとか…! 詳しい内容は作成者さんのZennをご確認ください。今回私がやるのはとりあえずの実装のみ…。 zenn…
お疲れ様です。 以前の記事でHuggingFace(transformersライブラリ)から利用できるDETRという物体検出モデルを実装しました。 今回はDETR以外の物体検出モデルを使ってみようと思います。 前回 ソースコード 使用するデータセット PCのスペック HuggingFace…
お疲れ様です。 HuggingFace(transformersライブラリ)から利用できる物体検出のDeepLearningモデルを試してみたのでその紹介です。 物体検出についてはざっくりというと画像内の物体を矩形(Bounding Box)で囲って検出するものになります。 下図の例では…
お疲れ様です。 Pythonでディープラーニングのプログラムを書く際、その際に様々なライブラリにお世話になるかと思います。 その中で、モデルアーキテクチャの定義と同時に特定の事前学習済みモデルの重みファイルを自動でダウンロードしてくれる機能がある…
お疲れ様です。 Pytorch使用時に発生したエラーの対処についての備忘録です。 基本的には調べたサイトや記事をまとめただけになります。 エラー文 PyTorch: RuntimeError: device >= 0 && device < num_gpus INTERNAL ASSERT FAILED 公式GitHubのissueでも議…