オブジェクトとシーン認識
画像や動画から人物、物体、車両、動物、テキスト(OCR)、レイアウト、選択マーク、バーコード、数式を高精度で検出します。
機能
マルチモーダル:画像、動画、音声、文書。スキーマベースで信頼度とソース参照を提供 – ドイツの Azure 上で GDPR 準拠。
画像や動画から人物、物体、車両、動物、テキスト(OCR)、レイアウト、選択マーク、バーコード、数式を高精度で検出します。
音声・動画の文字起こしと話者分離(ダイアライゼーション)、タイムスタンプ付きで完全な追跡性を確保します。
認識した全コンテンツを Markdown とベクトルでインデックス化 – 即時検索可能で、Retrieval-Augmented Generation にすぐ利用できます。
自然言語でシーン・人物・状況を検索:「製品 X が紹介されている動画をすべて見せて」。
写真・動画・音声アーカイブに質問してください。showmi はフレーム、領域、タイムスタンプを参照して回答します。
showmi は tellmi(通話録音)、talkmi(翻訳)、askmi(ナレッジ)、notemi(文書)とシームレスに連携します。
JSON スキーマで独自フィールドを定義 – 抽出、分類、生成に対応。1 アナライザーあたり最大 1,000 フィールド。
各抽出値には信頼度スコア(0〜1)とソース参照が付与され、信頼性の高いストレートスループロセッシングを実現します。
動画は自動でシーンに分割され、コンテンツは事前分類されます – フィールドあたり最大 300 カテゴリ。
ユースケース
showmi は生産写真を分類(亀裂、傷、変色)し、検出ごとに信頼度を返します。境界事例のみが手動レビューに回ります。
動画はシーンに分割され、話者が特定され、コンテンツがインデックス化されます。クリック一つで動画の該当秒へジャンプします。
カメラ映像中の人物・車両を検出し、分類とタイムスタンプ付きで監査可能な形で Azure ドイツに記録します。
写真と音声メモを構造化された損害レコードに変換:カテゴリ、見積額、説明 – そのまま損害管理システムへ。
会議の音声・動画から要約、アクションリスト、センチメント、KPI フィールドを生成 – タイムスタンプをソースとして提供します。
プラットフォームとオプション
showmi は Microsoft のマルチモーダル Foundry サービス(GA、API 2025-11-01)を利用。1 本のパイプラインに 4 つのモダリティ – ドイツでホストされ GDPR に準拠。
拡張モデル利用により、複雑なドキュメントや画像でも高い精度を提供。有料の任意アドオンとしてご利用いただけます。
ヘイト、暴力、性的コンテンツ、自傷行為に関する安全しきい値を調整可能 – 独自の要件を持つ個人ユーザーにも適しています。
クラウドデプロイメント
100% SaaS – インストール不要
すべての製品は完全にクラウドで動作。ダウンロードなし、セットアップなし、IT部門不要 – ブラウザを開くだけで開始できます。
すべての一般的なオペレーティングシステムと互換性あり:
showmi はまもなく利用可能になります。今すぐ早期アクセスにお申し込みいただき、私たちと一緒に製品を形作りましょう。
スパムなし。第三者への提供なし。GDPR 準拠。