Windows ML では、さまざまな AI シナリオに対応するさまざまな ONNX モデルがサポートされています。 このページでは、さまざまなフレームワークや言語から Windows ML を使用するためのサンプルと、一般的な AI タスク用のすぐに使用できるモデル サンプルを提供します。
AI 開発ギャラリー
AI 開発ギャラリーは、Windows ML サンプルを探索する最も簡単な方法です。 次の機能を提供します。
- 各モデル シナリオの対話型デモ
- すべてのサンプルの完全なソース コード
- 独自のアプリでモデルを使用できるように、ワンクリックで Visual Studio プロジェクトにエクスポートする
ヒント
AI Dev Gallery の各モデル サンプルには、完全なソース コードが含まれています。 Visual Studio へのエクスポート機能を使用して、選択したモデルで作業プロジェクトをすばやく作成します。
フレームワーク統合のサンプル
GitHub の Windows App SDK サンプル リポジトリには、Windows ML をさまざまな言語とフレームワークに統合する方法を示すサンプル アプリケーションが含まれています。
| Language | フレームワーク | パッケージの種類 | 依存関係の種類 | Link |
|---|---|---|---|---|
| C# | コンソール | アンパック | フレームワークに依存 | リンク |
| C# | WPF | アンパック | フレームワークに依存 | リンク |
| C# | WinUI | MSIX | フレームワークに依存 | リンク |
| C# | WinForms | アンパック | フレームワークに依存 | リンク |
| C++ | コンソール | 個別の EXE を含む DLL | フレームワークに依存 | リンク |
| C++ | コンソール | アンパック | 自己完結型 | リンク |
| C++ | コンソール | MSIX | フレームワークに依存 | リンク |
| Python | コンソール | アンパック | フレームワークに依存 | リンク |
シナリオ別のモデル サンプル
次のセクションでは、各 AI シナリオで使用可能なモデルと、そのサイズとハードウェアのサポートを示します。 [自分で試す] をクリックして、AI Dev Gallery アプリでサンプルを開きます。
大規模言語モデル (LLM) - テキスト生成
最先端の言語モデルを使用して会話型テキスト応答を生成します。
| モデル | ハードウェア | サイズ |
|---|---|---|
| Phi 4 ミニ CPU | CPU | 4.6 GB |
| Phi 3.5 ミニ CPU ACC4 | CPU | 2.6 GB |
| Phi 3 ミニ CPU | CPU | 2.5 GB |
| Phi 3 Mini CPU ACC4 | CPU | 2.5 GB |
| Phi 3 Medium CPU ACC4 | CPU | 8.6 GB |
| Mistral 7B Instruct 0.2 CPU | CPU | 4.6 GB |
| Mistral 7B Instruct 0.2 CPU ACC4 | CPU | 4.6 GB |
大規模言語モデル (LLM) - マルチモーダル
視覚対応言語モデルを使用して画像を分析し、テキストの説明を生成します。
| モデル | ハードウェア | サイズ |
|---|---|---|
| Phi 3 Vision CPU | CPU | 3.0 GB |
| Phi 3.5 Vision CPU | CPU | 3.0 GB |
テキスト埋め込み (セマンティック検索)
セマンティック検索と類似性の一致のために、テキストをベクター埋め込み形式に変換します。
| モデル | ハードウェア | サイズ |
|---|---|---|
| all-MiniLM-L12-v2 | CPU、GPU | 127.2 MB |
| all-MiniLM-L6-v2 | CPU、GPU | 86.4 MB |
イメージの生成
拡散モデルを使用してテキスト プロンプトから画像を作成します。
| モデル | ハードウェア | サイズ |
|---|---|---|
| 安定拡散 v1.4 | CPU、GPU | 5.1 GB |
画像の分類
画像を定義済みのカテゴリに分類します。
| モデル | ハードウェア | サイズ |
|---|---|---|
| MobileNet v2 1.0 | CPU、GPU | 13.3 MB |
| ResNet101 v1 7 | CPU、GPU | 170.6 MB |
| ResNet50 v1 7 | CPU、GPU | 97.8 MB |
| SqueezeNet 1.1 | CPU、GPU、NPU | 4.7 MB |
画像オブジェクトの検出
画像内のオブジェクトを検出して見つけます。
| モデル | ハードウェア | サイズ |
|---|---|---|
| RCNN 10 の高速化 | CPU、GPU | 159.6 MB |
| RCNN 12 の高速化 | CPU、GPU | 168.5 MB |
| YOLOv4 | CPU、GPU | 245.5 MB |
画像のセグメント化 (バックグラウンド検出)
画像内の背景から前景の件名を分離します。
| モデル | ハードウェア | サイズ |
|---|---|---|
| SINet | CPU、GPU、NPU | 404.7 KB |
人間の姿勢検出
人間の体のポーズと画像の重要なポイントを検出します。
| モデル | ハードウェア | サイズ |
|---|---|---|
| HRNet ポーズ | CPU、GPU、NPU | 108.9 MB |
道路のセグメント化
道路写真を自動運転およびマッピングアプリケーション用の検出可能なゾーンに分割します。
| モデル | ハードウェア | サイズ |
|---|---|---|
| FFNet 78s | CPU、GPU、NPU | 104.9 MB |
| FFNet 54s | CPU、GPU、NPU | 68.8 MB |
顔検出
画像内の人間の顔を検出して見つけます。
| モデル | ハードウェア | サイズ |
|---|---|---|
| FaceDetLite | CPU、GPU、NPU | 3.4 MB |
オーディオ文字起こし (音声からテキストへ)
音声認識モデルを使用して、音声を書き込まれたテキストに変換します。
| モデル | ハードウェア | サイズ |
|---|---|---|
| 小型ウィスパーCPU | CPU | 73.8 MB |
| Whisper 小さなCPU | CPU | 422.5 MB |
| ささやき中 CPU | CPU | 1.3 GB |