映像・画像解析AIを導入支援する開発パートナー選びのポイント

「AIによる映像・画像解析」の市場は2年後には、1,500億円のマーケットに拡大するようです。

今後「映像・画像解析AI」を導入展開する業界は底知れないようです。

最近「映像・画像解析AI」を導入のトピックスを頻繫に見聞きしますが、「映像・画像解析AI」は昔から研究・開発・実装されている技術です。

防犯カメラは、20世紀には導入されていました。

「映像・画像解析AI」の精度が飛躍的に向上しているので、導入事例が多く、トピックスを見聞きするのです。

「映像・画像解析AI」の精度が飛躍的に向上した技術は、機械学習(マシンラーニング)・深層学習(ディープラーニング)の登場で実用化の範囲が飛躍的に広がっています。

「映像・画像解析AI」機能は、映像・画像に写る「モノ」を識別すること・その写る「モノ」がどの位置にあるかを特定すること・その「モノ」が何かに似ているか特定することです。

「映像・画像解析AI」機能には、画像を解析する「大量なデータの蓄積」「機械学習」「特定」の工程が必要になります。

これから「映像・画像解析AI」を紹介していきます。

 

 

1.映像・画像解析AIとは何か?

「映像・画像解析AI」は、最新IT技術であるといわれていますが、「映像・画像認識」技術は、20世紀(1960年ころ)から研究・開発・導入事例があります。

たとえば「OCR装置で文字の読み取り機能」「顔認証の仕組み」「指紋認証の仕組み」は、「映像・画像認識」技術の範囲で、古くから導入・展開されています。

「文字」「顔」「指紋」の認識は、コンピューターに基本データを記録させることで、入力されたデータが記憶データに合致するアイテムを検索して結果を出します。

しかし、予め「文字」「顔」「指紋」とわかっていればよいのですが、「モノ」入力データにして「それは何か」を判定することは、コンピューターができない機能でした。

こどもからお年寄りまでが「モノ」を見て「これは○○」であると簡単に識別できますが、コンピューターはできませんでした。

しかし、2010年代(今から10年ほど前)になるとに入ると、映像・画像解析は大きな技術革新を迎えました。

入力データを基にしてコンピューターがもつ深層学習(ディープラーニング)を活用した機械学習技術が、「モノ」を「○○」と判定したのです。

この事象を契機にして「映像・画像解析」の実用化がすすみました。

近年は、一般の人々が人工知能(AI)を意識することなく日常生活のなかで利活用しています。

「映像・画像解析」は深層学習(ディープラーニング)技術の誕生とコンピューター・ハードウェアの性能がアップしたことで、「映像・画像解析AI」が実用化されました。

深層学習(ディープラーニング)とは、コンピューターが自動で収集した大量のデータを基に、コンピューターが自動で学習する技術です。

精度の高い結果を導くために必要な情報から、コンピューターが自らデータを集めることができることが特徴です。

深層学習(ディープラーニング)は、人工知能(AI)分野の機械学習(マシンラーニング)のカテゴリーに含まれます。

機械学習(マシンラーニング)は大量のデータを基にして自らから学習します。

導入後は、間違いを修正しながら最適化していきます。

深層学習(ディープラーニング)は限りなく賢くなっていきます。

 

 

2.映像・画像解析AIには何ができるか

「映像・画像解析AI」には何ができるかを紹介します。

「映像・画像解析AI」機能には、入力データの「分類」、該当データの「検出」、架空データの「生成」があります。

第1に入力データの「分類」は、「映像・画像解析AI」の基本処理になります。

入力データに何が写っているか識別します。

たとえば、街中を撮影した「映像・画像」の入力データから、「4ドアセダンの自動車」を識別します。

その「4ドアセダンの自動車」の生産メーカー、車種、年式、ナンバープレートを識別することができます。

さらに「4ドアセダンの自動車」がどこの道路を走行いていたか解析できるようになりました。

日本の警察が導入している「Nシステム(自動車それぞれのナンバープレートを読み取り、手配されているナンバーと一致するかどうか確かめるために仕組み)」は、「分類」機能を活用した導入事例です。

第2に該当するデータの「検出」です。

入力された映像・画像データに何が写っているか識別します。

さらに映像・画像データのどの場所に対象となる「モノ」が写っているか識別します。

その場所を識別するときは、検出したところからの距離を導きます。

また、映像・画像の入力データから「建物」「歩道」「車道」「横断歩道」等を分類して、グループ化して抜き取りすること・抜き取りしないことができます。

その映像・画像の入力データ内の「個人情報」に配慮するときは、抜き取りをしない設定ができます。

また、自動車の自動運転で走行ルートを決定する場合に利用されています。

第3に架空データの「生成」です。

架空の人物や生物または、実在の人物や生物の画像を生成することができます。

実在の人物として生成するとフェイク画像として悪用される問課題があるので、容易に利用してはいけません。

人工知能(AI)が学習するためので、フェイク画像として生成することを抑止できます。

 

 

3.映像・画像解析AIの仕組み

「映像・画像解析AI」の仕組みを紹介します。

子供からお年寄りまで、当該の映像・画像データに「何が写っているか?」すぐにわかります。

人類は大脳の前頭頂という部位で瞬時に判定しますが、コンピューターには人類の大脳-前頭頂と同様な働きをする機器かありません。

コンピューターが人類の大脳-前頭頂の機能に近づける技術を作り出すには、長い歴史と時間が必要でした。

現在も研究・開発・試作をしているので開発途中といったところでしょうか?
コンピューターが「モノ」を識別するためには、基本となるデータ・それを補う大量なデータが必要になります。

たとえば、「4ドアセダンの自動車」を識別するときは、「凸」形・全長3メートル~5メートル・高さ1.5メートルくらい・車幅1.5メートルから2メートル以内・タイヤが前後左右に4つ実装されていることを定義する必要があります。

さらに前後左右に4つ実装されている「タイヤ」は黒色で、直径が80cm~100cmあり、幅は20cm~30cmあります。

その「タイヤ」の中央には「ホイール」という金属があることを定義します。

この定義を人類がおこなうと、膨大な作業量で記憶することと、抽象的な画像イメージをコンピューターに指示するコンピューター言語に置き換えることができるでしょうか?
人類は「4ドアセダンの自動車」を識別するときに、イメージを言語に置き換えして識別することはしません。

子供時代の幼少期に「これは4ドアセダンの自動車」であることを教えてもらい、徐々に「4ドアセダンの自動車」として記憶していきます。

「映像・画像解析AI」機能は、コンピューターに「これは4ドアセダンの自動車である」「凸型をしている」「前後左右に4つのタイヤがある」ことを何度も繰り返し記録させます。

この動作を深層学習(ディープラーニング)といいます。

この深層学習(ディープラーニング)を利活用して、「モノ」の識別をどのようにするのか紹介していきます。

第1に学習用の参考データを準備します。

「映像・画像データ」から「モノ」を識別するために、その「モノ」定義をするためのパターンが必要になります。

そのため「画像・映像データ」を大量に記録させること必要です。

その大量データにその「モノ」は何かをマーキングする必要があります。

たとえば「4ドアセダンの自動車」は「凸」型をしている。

「タイヤ」は「●」をしていると定義するのです。

この定義する工程をアノテーション(個々のデータに対して関連する情報を注釈として付けること)といいます。

「映像・画像解析AI」の仕組みにはアノテーションが必要になります。

第2に準備した学習用の参考データから、アノテーションした「モノ」の特徴が合致するアイテムを抽出します。

その組み合わせによって「4ドアセダンの自動車」「タイヤ」であるという推論を導きだします。

第3に上記の「推論」で導きだしたことを基にして、「4ドアセダンの自動車の確率が95%である」との判定を出します。

従来は「4ドアセダンの自動車」は「凸」型で全長が3メートル~5メートル等の特徴的なパターンを抽出するために、人々がコンピューターに定義をする必要がありました。

現在は、深層学習(ディープラーニング)技術の進化によって、映像・画像を画素(ピクセル単位)にまで分解して形状・大きさの識別を高い精度でできるようになりました。

 

 

4.映像・画像解析AI技術が何に活用されているのか

「映像・画像解析AI」技術が何に活用されているのか紹介します。

機械学習(マシンラーニング)・深層学習(ディープラーニング)技術の進化により、映像・画像データを解析する精度が高まり、活用範囲が飛躍的に広がりました。

これから事例を紹介します。

第1に「顔認証」です。

「顔認証」が人工知能(AI)により画像認識技術の一種です。

仕組みは、主に頭部の骨格と目・鼻・口の位置と大きさを基にして、人間の顔を判別する認識技法です。

導入にはメリットが多くあります。

①なりすましが困難になります。

②スマートフォンの画面ロック機能に活用できます。

③空港での出入国チェックができます。

④テーマパークの入口で本人確認として活用されています。

前記のように人工知能(AI)の映像・画像認識を使った技術は身近なものに変遷しています。

また「顔認証」映像装置の前面に立って判定するだけではなく、顔が斜めのケース・顔に建物の影がかかるケースでも「顔認証」機能が実行されます。

映像・画像データから対象物を多面的に探索します。

人工知能(AI)の映像・画像認識が優れている証といえます。

第2に自動車の自動運転です。

自動車走行時の映像・画像解析は人々の目の役割を担います。

自動車に搭載したセンサー機器(レーザー光線を照射して遠距離にある対象までの距離の測定・その対象の性質を分析します)・搭載したカメラ画像を人工知能(AI)機能でリアルタイムに解析します。

周辺環境を認識して障害物を避け、法定速度(40km)での自動走行の実証実験は始まっています。

人工知能(AI)機能の進化により「自動運転レベル(高度運転自動化)」「自動運転レベル5(完全運転自動化)」に向けて実用化がすすみます。

第3に「パン屋さん」で導入している人工知能(AI)レジを紹介します。

個々のパンの意大きさ・形状を映像・画像認識して支払金額を算出する画像認識システムです。

映像・画像識別されたパンは、従業員とお客様向けた大型モニターに表示されることが、安心感を与えて、近未来の店舗システムの先端であることを演出しています。

大型モニターに支払い金額が表示されたら、お客様は支払いをします。

その間に従業員がパンを袋に詰めるセミセルフレジになっています。

現金を触った手でパンを取り扱わなくていいとことが衛生面のメリットです。

映像・画像認識が精度100%であることより、衛生面を優先したシステムです。

今後、人工知能(AI)技術を搭載した「映像・画像解析」システムの進歩が期待されています。

 

 

5.映像・画像解析AIを導入支援する開発パートナー選びのポイント

「映像・画像解析」の人口知能(AI)製品は多くの大手電機メーカー、ITベンダー企業、ITベンチャー企業が手がけています。

そのなかで開発パートナー選びは、導入実績が数多く有するソリューションを提案・提供する企業をお勧めします。

また、企業・団体が導入している基幹システムとの連携を考慮する必要があります。

「画像・映像解析」と基幹システムを異なるソリューションにすると、データ連携がスムーズにいかないことになります。

上記の導入事例のパン屋さんのセミセルフレジシステムをみてみましょう。

パンの販売は「映像・画像解析AI」によって代金の清算ができます。

清算ができた時点でデータの流れが途絶すると、販売管理システム・在庫管理システムへの連携がされません。

そのため、セミセルフレジの売上データを販売管理システム・在庫管理システムにリンケージしないと効率化につながりません。

そのため、基幹システムを導入している開発パートナーに相談してみることをお勧めします。

大手電機メーカー、ITベンダー企業は基幹システムをする部門とは別に「人口知能(AI)」「画像・映像解析」の支援サポート部門があります。

現行の基幹システムを導入した開発パートナーの営業担当やプロマネに相談してみましょう。

 

 

まとめ

画像解析・映像解析は人工知能(AI)機能の進化によって、活用分野があらゆる領域に拡大しています。

新たなサービスやビジネス価値・機会の創出に期待されています。

 

 

システム開発のITパートナー探しをされるのであれば

システム開発のITパートナー探しをされるのであれば「システム開発コンシェルジュ」で是非ご相談いただければと思います。

以下のフォームより開発でご相談いただきたい内容などご相談ください。

    関連記事一覧