AIと括られると人は不安や思考停止に陥りますが
実際は身近にあふれ出しています。

AIの基本は「認識」と「学習」になります。

ここを混同しがちですが、脳の中で言うと「判断しながら学習して最適値を導く」
なんで、括りは一緒ですが別の物になります。

「認識」について

「認識」と言っても人間であれば五感(第六感もありますが)
五感とは視・聴・嗅・味・触の五つの感覚

この五感の中で現在コンピュータに出来るのは視覚と聴覚になります。
「画像認識」「音声認識」「文章認識」に層別できます。

それぞれは身近になって来ましてよね。
「Hey Sri 音楽かけて」「アレクサ エアコン付けて」
が音声認識です。
「外国語翻訳」などは音声認識と文章認識の組み合わせですね。

「画像認識のメカニズム」について

少し歴史をさかのぼってみてみましょう。
FAX文字を送る仕組みって考えた事ありますか?

文字や絵が電話回線を通じて送れるって本来凄いと思いませんか?
これは「0,1」のデジタル判断を行い、「0:OFF、1:ON」に置き換えています。

図例を見て下さい「X文字が」色分けしていますが

「白:0、黒:1」で表すと
10000001
01000010
00100100
00011000
00011000
00100100
01000010
10000001

に置き換えられ、これを信号「0:OFF、1:ON」に置き換えてデータとして送り
受け取った方が、この信号を「白:0、黒:1」に変換して表示している機能です。

これが全てのベースになります。

例では「8*8マス(64ビット)」ですが、コンピュータの進化で細かな画素と高速で
データを変換する技術が確立でき

これをカラーでも表現する事から始まりました。
鋭い方ならwwここである程度理解できたと思いますが。

画像が数値に変換出来てしまえば、次の処理はコンピュータではお手の物です。
前画像(数値)と後画像(数値)を比較して同じであれば「同じ」変化があれば「違う」
と言う判断が出来ます。

これが全ての基本となりますので、先ずはご理解下さい。

ここまでは誰でもある程度は想定できますよね。
しかし、これは単なる「0,1判定」でしかありません。

まだまだ人の脳判断とは比較できませんよね。
そこで次に追及するのが「0.1判定」だけでなく「0に近い0、1に近い1」と言う
曖昧判断を行う事が進んだ訳です。


「動いている時も同じ物と判断」
「同じ形でも色が違うと違うと判断」

この様な事(データ)をコンピュータに覚えさせて行き、判断材料を大量に集めます。
これが俗に言う「ビッグデータ」です。
この「ビッグデータを学習」判断材料を人が指示しながらパターン化していきます。
その「パターン化データ」と判断要素データを比較して判定するのが大きな流れです。

簡単な説明はここまでですが

実際に難しいのが「判断要素」になります、今までであれば
プログラマーが判断指示をプログラミングしますが、実際は判断要素が多すぎて追いつきません。

そこで登場する考え方が「機械学習」と言う判断になります。
ここは次の章でひも解いてみます。

今回の章は「画像判断」の基礎部分です。
特に何の役にも立ちませんが雑学として抑えてみて下さい。

記事投稿 豊田

CommStepLLC代表の豊田
群馬県太田市でシステム会社を起業し中小企業様向けのシステム開発を行うかたわら
企業さまの社員研修をサポートさせて頂く取り組みを行っております。
ブログ投稿テーマは主にITに関する情報からビジネスに役立つ情報をお届けしていきます。