イントロダクション

完了

コンピューター ビジョン は、コンピューターが画像、ビデオ、ライブ カメラ フィードなど、世界の視覚情報を解釈して理解できるようにする AI の分野です。 コンピューター ビジョン機能は AI モデルを利用し、あらゆる種類の時間集中型タスクの自動化をサポートします。

このモジュールでは、オブジェクトの識別と分析、パターンの認識、画像内のテキストの読み取り、シーンの解釈を人間と同じように行うことができる AI モデルについて説明します。 また、このモジュールでは、画像分析を超えて新しいビジュアル コンテンツを生成できるビジュアル AI モデルについても説明します。 これらの機能を組み合わせることで、画像検索やドキュメント分析から、創造的なツールや対話型の AI エクスペリエンスまで、さまざまなアプリケーションを実現できます。これにより、システムは視覚的な情報を表示および作成できます。

コンピューター ビジョンの次のアプリケーションについて考えてみましょう。

  • 製造における欠陥検出: AIビジョンシステムは、組み立てライン上の製品をリアルタイムで検査します。 物体検出と画像セグメント化を使用して表面欠陥、ミスアラインメント、または欠落しているコンポーネントを検出し、無駄を減らし、品質管理を改善します。

  • 医用画像解析: コンピュータービジョンは、放射線、MRI、CTスキャンを放射線医が分析するのに役立ちます。 AI モデルでは、腫瘍や骨折などの異常を強調し、早期診断を支援し、ヒューマン エラーを軽減できます。

  • 小売での棚の監視: 小売業者は AI ビジョンを使用して店舗の棚を監視します。 カメラは、製品の在庫切れや誤った位置を検出し、リアルタイムの在庫更新を可能にし、カスタマー エクスペリエンスを向上します。

  • 自動運転車: 自動運転車は、道路標識、車線標識、歩行者、その他の車両を認識するために、コンピュータビジョンに依存しています。 これにより、動的環境での安全なナビゲーションと意思決定が可能になります。

次に、エンタープライズ AI 運用とアプリケーション開発のために Azure 上で提供される Microsoft のサービスとしての統合プラットフォーム である Microsoft Foundry のマルチモーダル モデルについて説明します。

私たちは、異なる人々が異なる方法で学ぶのが好きであることを認識しています。 このモジュールをビデオベースの形式で完了するか、コンテンツをテキストと画像として読み取ることができます。 テキストにはビデオよりも詳細な情報が含まれているため、ビデオ プレゼンテーションの補足資料として参照したい場合があります。