AI

好評発売中！

いきなりプログラミングPython

ついにWATLABブログから書籍「いきなりプログラミングPython」が発売しました！

2025.03.31

pydominoで日本語音声データの強制アライメントをやってみた

　日本語のテキストと音声を音素レベルで対応をとる強制アライメントツールpydominoを使ってみました。pydominoのインストールから使い方、音素対応表の紹介を行っています。また、実際に母音や子音を含む音声データを波形やスペクトログラムで可視化しながら結果の検証を行いました。

続きを読む

2025.03.16

PyTorchで始める手書き文字認識（MNIST）学習・検証コード

　機械学習を活用したアプリ開発を学ぶ第一歩として、PyTorchを使った手書き文字認識（MNIST）に挑戦します。本記事では、モデルの学習から検証までのコードを習得しましょう。MNISTの学習ができるようになれば、自分のデータで学習モデルを作成することもできるようになります。

続きを読む

2023.12.24

マイクに話しかけて自動翻訳するPythonプログラム

Pythonを使えば、普段の会話を精度良く翻訳するアプリも簡単につくることができます。まずspeech_recognitionによる音声認識技術を使い、音声をテキストに変換、そして次にdeep_transtatorを使ってテキストを任意の言語に翻訳します。ここではこれらを駆使したPythonプログラムの例を紹介します。

続きを読む

2023.09.24

YOLOv8のposeで動画ファイルから姿勢推定をしてみた

Pythonの外部ライブラリultralyticsを用いれば、YOLOを使ってバウンディングボックスの描画だけでなく、高度な姿勢推定も実現可能です。この記事では、動画ファイルに対してposeモデルを利用した姿勢推定コードの作成と利用方法を分かりやすく紹介します。

続きを読む

2023.08.20

Python/ultralyticsでYOLOv8をただ使ってみた

機械学習に強いPythonとはいえ、ゼロから精度の良い物体検出アプリをつくるのは骨が折れるでしょう。しかしultralyticsというライブラリを使えば数行のコードでキーとなる検出部分を書くことができます。ここではultralyticsを用いたYOLOv8の説明を行います。

続きを読む

2023.08.19

Python/SpeechRecognitionで音声認識してみた

機械学習で有名なPythonを使って「音声認識」をしてみます。今回は初心者が最も導入しやすいSpeechRecognitionをインストールし、Googleのサービスを使ったGoogle Speech Recognitionによる音声認識プログラミング事例を紹介します。

続きを読む

2022.02.05

機械学習で回帰した2つの応答曲面を多目的最適化で探査してみた

単一の応答曲面上を遺伝的アルゴリズムで探査するコードを書いたので、次はトレードオフ関係を持つ2つの応答曲面間の多目的最適化に挑戦します。ここではPyTorchによる応答曲面の作成からPlatypusによる多目的最適化、結果の可視化まで全てPythonで書いた内容を紹介します。

続きを読む

2022.01.20

1つの応答曲面を遺伝的アルゴリズムで探査するPythonコード例

機械学習で応答曲面を求めた後、その曲面（学習済モデル）の最小値や最大値を探査したい場合があります。ここではPythonによる実現の例として、とりあえずPyTorchで機械学習→PlatypusのNSGA-IIで探査といった方法を試してみます。

続きを読む

2022.01.09

PyTorchモデルをcloudpickleで保存・読み込みする方法

scikit-learnではpickleを使って学習済のモデルを保存したり読み込んだりできていましたが、PyTorchのモデルが読み込めない問題に直面したので解決方法をメモします。ここでは最も簡単だと感じたcloudpickleを使った方法を紹介します。

続きを読む

2021.12.26

Platypusで多目的最適化からパレートフロントを求める方法

多目的最適化とは、2つ以上のトレードオフ関係にある複数の目的関数を同時に最適化する方法の事です。ここではPythonライブラリであるPlatypusを使って簡単な多目的最適化を行い、パレートフロントを求めるコードを紹介します。

続きを読む

12 3 4 5 6